HMMs для генного прогнозу.

HMMs проходять підготовку за послідовностей, які є членами відомих генів класу

HMMs дає ймовірність того, що певна послідовність належить до класу генів

Модель для використання ПММ для виконання гена пророкування навчається на безлічі відомих генів. HMM в слайд навчався на 2000 чоловік інтронів. Його кругової схемою призначений для виявлення повторюваних ділянок в ДНК. Барів у кожному квадраті представляють ймовірності того, що держава буде мати особливе значення бази. Такі моделі, як той, на цьому слайді може бути використана для оцінки вірогідності того, що конкретний послідовність гена або належить до певного класу послідовності. Приклад популярної програми передбачення генів, які використовуються ПММ є GenScan.

36. Алгоритми вторинної структури визначення

Chou-Фасман / GOR метод

На підставі експериментально визначених частот амінокислот в вторинної структури

Алгоритми Машинне навчання

нейронних мереж

Найближчого сусіда методи

Навчання на раніше вивели структур для виявлення амінокислот моделей кислоти в вторинної структури

Ряд алгоритмів були розроблені для прогнозування вторинної структури (наприклад, альфа-спіралей і бета-складчастої аркушів) білків, засновані на їх амінокислотної послідовності. Один з методів, Chou-Фасман / GOR метод, використовує експериментально певні амінокислоти частотах кислот, пов'язані з різними видами вторинних структур. Якщо запит амінокислотної послідовності має амінокислотним складом близька до знайденої в експериментально певні структури, то вважається, що призводить до тієї ж вторинної структури. Інші методи використовують алгоритми машинного навчання, які навчаються за амінокислотної послідовності вторинної структури з білків, тривимірні структури вже визначені експериментально. Алгоритми машинного навчання включає нейронних мереж і найближчих сусідів методами. Найближчого сусіда методи пошуку найближчих матчів між запитом послідовності і членів навчальної множини.

37. Аналіз даних мікрочіпів

Microarrays можна виміряти експресії тисяч генів одночасно

Величезні обсяги даних вимагають комп'ютерів

Види аналізу

Ген-на-ген

Метод: Статистичні методи

Класифікація груп генів

Метод: алгоритми кластеризації

Виведення моделі регуляції генів

Метод: У розробці

До цих пір в цій главі розглядаються експериментальні дані (наприклад, нуклеотидних та амінокислотних послідовностей), які вже були оброблені і архів. У цьому розділі ми зосередимося на алгоритми біоінформатики для обробки сирих експериментальних даних, отриманих мікрочіпів. Тому що мікрочіпи вимірювання рівня експресії тисяч генів одночасно, ці дані неможливо обробити без використання комп'ютера. Кілька видів аналізу можливо. Аналізуючи дані, дивлячись на рівні експресії окремих генів вимагає простої статистичних методів, які використовуються в широкому спектрі інших біологічних експериментів. Алгоритми кластеризації пропонують більш високий рівень аналізу, який розглядає мікрочіпів даних в термінах групи генів, а не окремі гени. Нарешті, біологи хотіли б інтерпретувати мікрочіпів даних в термінах моделі регуляції генів. Методи, пов'язані з цим напрямком досліджень знаходяться в стадії розробки.