BLAST results

На графічному дисплеї в слайд-шоу послідовностей BLAST, що зміг вирівняти по МАШ-1 амінокислотної послідовності. Вирівнювання оцінки представлені на кольоровий панелі у верхній частині малюнка, з десятками переході від низької (чорний) до високого (червоний). Пронумеровані рядок нижче кольорова смуга являє амінокислотної послідовності МАШ-1. Нижче різні послідовності з кількох баз даних, які були визнані приєднуються до MASH-1. Точне положення кожної послідовності по відношенню до МАШ-1 послідовності вказує сфери схожість послідовностей. На наступному слайді показана BLAST результати більш докладно.

25. Докладні результати BLAST

 

На цьому слайді показаний список значимих вирівнювання послідовності МАШ-1. Траси були забиті допомогою BLOSUM62 забив матриці обговорювалося раніше. E значення, показані на правому, виміряти ймовірність знаходження зокрема вирівнювання шансів у базі даних пошуку. В якості значень Е прагне до нуля, статистична значимість вирівнювання збільшується. Зверніть увагу, як невелика E значень для найбільш значимих трас.

26. попарна відповідність MASH-1

HASH-2, людський гомолог МАШ-1

"+" Вказує на консервативну амінокислотну заміну

"-" Вказує на розрив / вставки

XXXX ... показує районах з низькою складністю

Одним із значущих для вирівнювання МАШ-1 був білок, званий хеш-2, людський гомолог МАШ-1. У нижній частині слайд-шоу попарно вирівнювання цих двох послідовностей, який був створений за BLAST. "Запит" послідовність відноситься до МАШ-1 і "Sbjct" послідовність HASH-2. Амінокислоти, які є ідентичними в створі показані в рядку символів між двома послідовностями. Плюс знаків у цьому рядку вказують консервативних амінокислотних замін. Мінус в оригінальній послідовності являють собою делеції (або вставки). X в МАШ-1 послідовності не є амінокислоти, але замість цього вказати область низького складності. Ці райони зазвичай містять короткі повтори і може створити проблеми в послідовності, вирівнювання тому що вони створюють високі бали, які насправді не відображає біологічне спорідненість двох послідовностей. Приклад область низького складності буде амінокислот PPCDPPPPPKDKKKKDDGPP послідовності кислоти. У програмі BLAST і веб-сайту NCBI постійно посилюється. Читачеві настійно рекомендується перейти на сайт і експериментувати зі своїм улюбленим послідовності.

27. мульти сіквенсне виміряння.

Використання декількох послідовностей вирівнювання

Автоматизована реконструкція послідовності фрагментів

філогенетичного аналізу

Визначення послідовності сімей

Проблема багаторазового вирівнювання послідовності

O (NM), де N є середня довжина послідовності і M число послідовності їх відповідність

Динамічне програмування буде працювати тільки для невеликих M

Евристичні методи необхідні

До цих пір ми обговорювали попарно вирівнювання послідовностей. Траси, які включають більше двох послідовностей називаються декількох послідовностей вирівнювання. Кілька послідовності вирівнювання необхідних для аналізу філогенетичних, визначення послідовності сімей, а також автоматизовані реконструкції фрагментів генів в послідовності проектів. На жаль, методи знаходження оптимального вирівнювання (наприклад, динамічні методи програмування) між декількома послідовностями є єдиним практичним протягом 8-10 послідовності. Це тому, що оптимальні методи O (NM), де N є середня довжина послідовності і M число послідовності. Таким чином, майже в кожному випадку евристичні методи є необхідними.

28. Some methods for global
multiple-sequence alignment

прогресивні методи

Вирівняти найбільш тісно пов'язаних послідовностей, а потім за вирахуванням відповідних них

Використовуйте філогенетичні дерева, щоб кількісно подібності

Нижня сторона: погані результати з віддалено споріднених послідовностей

ітераційні методи

Почніть з прогресивною вирівнювання

Вирівняйте послідовності після відходу з однієї послідовності

Додати лівої з послідовності

Повторювати до прийнятного вирівнювання досягається

імовірнісні методи

Приховані моделі Маркова

Евристичні методи множинного вирівнювання послідовностей можна розділити на прогресивні, що повторюється, і імовірнісні методи. Прогресивні методи вирівнювання найбільш тісно пов'язаних послідовностей, а потім за вирахуванням відповідних послідовностей. Ці методи не працюють добре для віддалене відношення послідовності. Ітераційні методи часто починається з поступовим вирівнюванням, видаліть послідовності з вирівнювання, а потім використовувати залишилися послідовності для створення "профілю" вирівнювання. Профіль використовується потім, щоб перебудувати послідовність, яка була вилучена. Потім процес повторюється до прийнятного вирівнювання була досягнута. Є також імовірнісні методи для глобального вирівнювання послідовностей, які використовують приховані моделі Маркова, описані більш детально далі у цій главі.

29. філогенетичного аналізу

філогенетичні дерева

Опишіть еволюційні відносини між послідовностями

Три найпоширеніших методів

максимальної економії

відстань

критерії максимуму правдоподібності

 

Фігура в слайд-шоу Філогенетичне дерево описують відносини віруси імунодефіциту людини зі всього світу. Розуміння філогенія має центральне значення для розуміння біології, тому що філогенія показує еволюційні взаємини організмів (або принаймні послідовності) один з одним. Три методу для побудови філогенетичних дерев зазвичай використовуються: максимальної економії, відстані і максимальної правдоподібності

30. Порівняння методів філогенетичної аналізу

максимальної економії

Знаходить оптимальне дерево (або дерев), що вимагають мінімальної кількості замін пояснити послідовність зміни

критерії максимуму правдоподібності

Знаходить найбільш ймовірних дерева

Як і в максимальній економії

відстань

Порівняти пар послідовностей для ряду відмінностей між ними

Після того, як група послідовностей буде вирівняний, на максимальній скупості метод будує дерево для кожної пар основ (або амінокислот) колонці у відповідність послідовностей. Кілька дерев можливі, але тільки ті, які зводять до мінімуму загальне число пар основ зміни збережені. Цей процес повторюється для кожної бази пару позицій, і кожна з дерева генерується потім використовуються для побудови великого дерева, який приймає все розмаїття послідовностей до уваги. Максимальна економія гарантовано дає оптимальне дерево в цих умовах. Метод максимальної правдоподібності спрямований на пошук найбільш ймовірних дерево задано безліч еволюційних припущень (наприклад, забивши системи пар підстав заміни). Це схоже на максимальній економії в тому, що він будує дерево для кожного стовпця в розстановці і що можна чекати, що дерево вимагає найменше число пар основ зміни, щоб бути найбільш імовірним дерева в цілому, однак, одне з найбільших переваг на метод максимальної правдоподібності в тому, що вона дозволяє дослідникам застосовувати різні еволюційні моделі для різних підмножин послідовностей, використовуваних в філогенетичного аналізу. Ця функція особливо корисна, коли послідовності віддалене відношення. У таких випадках, максимальної економії не працює, а також максимальної правдоподібності. Відстань методи пошуку пар послідовностей, які мають найменше число пар основ відмінності і згрупувати їх разом, як сусіди по філогенетичного дерева. Загалом, максимальної економії може бути використаний для тісно пов'язаних послідовностей, відстань хороший для менш пов'язані послідовності і максимальної правдоподібності корисно для послідовностей, які віддалене відношення. Дослідники часто використовують кілька методів для того, щоб підвищити довіру до їхніх результатів.

31. Алгоритмічна складність і філогенетичного аналізу

чотири кроки

послідовність вирівнювання

заміна моделі

побудова дерева

дерево оцінки

Будівля дерев і оцінка обчислювальних ресурсів

Евристичні методи, необхідні в більшості випадків

Є правило, чотири кроки в філогенетичного аналізу: декількома вирівнювання послідовності, створення моделі заміщення (або забив матриці), побудови дерева, і дерево оцінку. Як множинного вирівнювання послідовності, будівля деревом і деревом оцінки часто є обчислювально дорогою кроки, які потрібні евристичні методи для всіх філогенетичного аналізу, які включають понад 8-10 послідовності.