Обмеження цифрових обчислювальних машин

Цифрова обчислювальна машина

Представляє все в код з нулів та одиниць

архітектура комп'ютера

процесор

пам'ять

Input / Output

Переваги цифрового комп'ютера

детерміністичний

Мінімізація шуму

Комп'ютер продуктивності обладнання та дизайну місце інші обмеження на алгоритми. Навіть проблеми слухняний алгоритмічної складності може бути неможливо виконати на комп'ютері, який працює дуже повільно або недостатньо пам'яті. Для оцінки потужності комп'ютера, ми повинні розуміти основи комп'ютерної архітектури. Для цілей цієї глави термін "комп'ютер" використовується для позначення виключно на цифрових обчислювальних машинах. Цифрові комп'ютери охоплюють весь світ персональних комп'ютерів, мейнфреймів, калькулятори, стільникові телефони і т.д. продуктивність комп'ютера вимірюється кількість часу, необхідне для виконання фіксованого завдання. Велика частина обчислювальної потужності комп'ютера визначається його центральний процесор (CPU), який обробляє інструкції в програмі. Деякі комп'ютери мають кілька процесорів. Ще однією важливою особливістю цифрового комп'ютера є його пам'яті. Значення можуть бути збережені на кілька видів пам'яті, які розрізняються за своєю потужності і швидкості, з якою зберігаються значення можуть бути доступні. Наприклад, вона займає набагато більше часу, щоб отримати доступ до значенням, що зберігається на жорсткому диску, ніж це робить доступ до значення, що проживають в RAM (оперативної пам'яті), проте, жорсткий диск зазвичай має набагато більшу кількість пам'яті, ніж RAM. Пам'яті комп'ютера також може обмежити швидкість, з якою програма буде виконуватися. На додаток до процесорів і пам'яті, інші фактори також можуть мати вплив на продуктивність. Цифрові комп'ютери мають кілька дивовижних властивостей. Вони є детермінованими, а це означає, що програма із заданим набором параметрів завжди буде виконуватися точно так само, незалежно від того, коли воно виконується. Цифрові пристрої і звести до мінімуму шум, тому що вони ігнорують малих випадкових електричних коливань. Нарешті, тому, що цифрові сигнали вони використовують точно визначені, як рядки з нулів і одиниць, програми, які можна запускати на одному комп'ютері можна, в теорії (і з невеликим програмного забезпечення), буде працювати на іншому комп'ютері. Тим не менше, як показує наступний слайд, цифрові обчислювальні машини також мають певні обмеження, які виходять за рамки нинішніх можливостей технології.

Обмеження цифрових обчислювальних машин є концептуальними, а не тільки технологічні

Цифрові комп'ютери є детермінованими

Не в силах по-справжньому випадкового поведінки

Цифрові комп'ютери справу зі строго дискретні значення

Можна лише приблизно безперервної поведінки

Багато цікаві біологічні явища відбуваються в безперервному області простору і часу

Випадкові (або стохастичні) події, за визначенням, подія, яка не може бути передбачене. Багато природні явища, такі як відкриття і закриття іонних каналів, які регулюють електричний струм через мембрани нейронів, є стохастичними. На жаль, детермінований характер цифрових обчислювальних машин позбавляє їх генерації дійсно випадкових поведінки. Є способи, щоб обійти цю проблему, однак. Наприклад, випадкові числа можуть бути створені з алгоритмом називається генератор випадкових чисел, який використовує насіння число, засноване на деяких випадкових подій поза комп'ютера (наприклад, час, у який дослідник сідає, щоб запустити програму). Ситуація не така проста для використання цифрових обчислювальних машин для боротьби з безперервними значеннями. Безперервні значення може бути наближена на цифрових обчислювальних машинах, але, як цінності стають все менше і менше, більший обсяг пам'яті і потужності процесора не потрібно. Це питання обговорюється більш докладно в розділі цієї глави, присвяченої комп'ютерним моделюванням.

10. послідовність баз даних

Що таке база даних?

Індексований набір записів

Записи отримані за допомогою мови запитів

Технологія баз даних добре відома

Приклади послідовності бази даних

GenBank

Охоплює всі публічно доступні білків і нуклеотидних послідовностей

Protein Data Bank

Містить 3-D структур білків

Бази даних є фундаментальною частиною революції біоінформатики. Велика частина концептуальної основи для бази даних вже були розроблені в 1960. До 1970-технологій баз даних вже пронизує велику частину державного і корпоративного секторів. Сучасні бази даних може бути описаний як добре організовані набори даних, які можуть бути доступні за допомогою мови запитів. Дві бази даних особливе значення для біологів GenBank ®, яка включає в себе всі публічно доступні білків і нуклеотидних послідовностей, і банк Protein Data, який містить високоякісний 3-D структур білків, нуклеїнових кислот і вуглеводів. Незважаючи ЗМІ галас про жахливості геномі людини, з точки зору цифрових комп'ютерів, всю послідовність однієї людини можуть вміститися на одному або двох CD-ROM. Як ми незабаром побачимо, це порівняння послідовностей, який представляє алгоритмічних задач.

11. Модель клієнт-сервер

Клієнти і сервери Програмне забезпечення процесів

Клієнти запитують дані з серверів

Сервери та клієнти можуть розташовуватися на одній або різних машинах

Клієнти можуть виступати в якості сервера для інших процесів і навпаки

Клієнт-сервер революція зробила доступ до геноміки даних швидко і легко. Не так давно, програмне забезпечення створене в першу чергу для автономних комп'ютерів. Це означає, програмісти часто доводилося винаходити колесо, і один комп'ютер доводилося робити все. Клієнт-сервер являє собою структуру, яка дозволяє окремим програмам для спілкування один з одним на одному комп'ютері або між декількома машинами. Біолог запитів послідовність база даних містить ілюстрації того, як клієнт-серверні системи працюють. Біолог типів послідовності в веб-браузері свого комп'ютерної лабораторії. Запит відправляється через Інтернет на комп'ютері GenBank ®, єдиною метою яких є діяльність в якості веб-сервера. Веб-сервер визначає, як запит біолога будуть оброблені, засновані на інформації, що міститься у запиті. У цьому випадку веб-браузер виступає в якості клієнта, а веб-сервер в якості сервера. Веб-сервер стає клієнтом, коли він просить двигуна BLAST пошуку (популярна програма для біоінформатики), щоб порівняти запиту послідовність з послідовностями в базі даних. Пошукова система запитує схожою послідовності з машини під управлінням сервера баз даних, що містять послідовність даних, що представляють інтерес. Кожен сервер обробляє запит і відправляє результати свого клієнта, поки відповідь на прохання біолог з'являється на своєму екрані. Технології для веб-браузерів, веб-серверів і серверів баз даних орієнтовані на загальні цілі і виходить за рамки цієї глави. Це програмне забезпечення біоінформатика, яка лежить між сервером бази даних і веб-сервер, який представляє інтерес для біологів, тому що це програмне забезпечення угод з алгоритмами, які спеціально розроблені для обробки біологічних проблем.

12. послідовність вирівнювання

Послідовність вирівнювання пошуку матчів між послідовностями

Два широких класів вирівнювання послідовності

Глобальний

місцевий

Вирівнювання може здійснюватися між двома або більше послідовностей

Для того, щоб порівняти дві або більше білків або нуклеотидних послідовностей, деякі скорингової системи повинні бути розроблені, щоб визначити, наскільки тісно пов'язані послідовності. Наприклад, велика кількість точок може бути дано протягом двох амінокислот, які матчу, менше число на два гідрофобних амінокислот і, можливо, негативне число для амінокислоту з гідрофобною бічним ланцюгом, а інший з гідрофільними один. Після того, як біологічно правдоподібними система підрахунку очок була розроблена, дві послідовності повинні бути вирівняні таким чином, що їх оцінка буде максимальною. Два типи вирівнювання можливо. Глобальне вирівнювання перекласти дві послідовності один на одного, поки вирівнювання знаходиться з максимальним рахунком. Локальний пошук для вирівнювання регіонів найбільша схожість між двома послідовностями і не брати до уваги високим балом області, які можуть виникати за межами цієї області. Прикладом глобального і локального вирівнювання показані на слайді.

13. Біологічне значення вирівнювання послідовності

Послідовність вирівнювання оцінити ступінь подібності між послідовностями

Схожі послідовності пропонують аналогічні функції

Білки з аналогічними послідовностями гратимуть схожі ролі біохімічних

Регуляторні послідовності ДНК, які схожі, швидше за все, мають аналогічну роль в регуляції генів

Послідовність схожість пропонує еволюційної історії

Менше відмінності означають останні розбіжності

Послідовність вирівнювання дозволяють біологам для кількісної оцінки ступеня подібності між послідовностями. Схожі послідовності, ймовірно, мають аналогічні функції. Наприклад, білки зі схожими амінокислотних послідовностей, ймовірно, мають біохімічну ролей, які пов'язані між собою. Крім того, подібні ДНК-послідовностей в регуляторних областях генів показують, що такі гени, ймовірно, будуть регулюватися тими ж факторами транскрипції. Послідовність також вказують на схожість еволюційних відносин, з меншою кількістю відмінностей між генами вказує на більш останніх загальних предків ген. Число членів були розроблені для опису послідовностей, які пов'язані (тобто подібне) один з одним. Послідовностей у різних організмів, як кажуть, ортолога, коли вони можуть бути простежені до загального предка. Паралогія аналогічні послідовності знаходяться в єдиному організмі, які розходяться після події дуплікації генів в геном організму.

14. Алгоритмічна проблема узгодження послідовностей

Порівняння схожих послідовностей однакової довжини проста

Як одна угода з вставками і прогалин, які можуть приховувати справжній схожість?

Як можна інтерпретувати мінімальної схожість?

Є послідовності насправді пов'язано?

Це вирівнювання шансів?

Порівняння двох тісно пов'язаних послідовностей майже однакової довжини проста і зазвичай може бути досягнуто шляхом візуального огляду. Це простоти порівняння видно з верхньої порівняння послідовності в слайд. Послідовність вирівнювання стає все більш важким алгоритмічна проблема, коли доводиться враховувати вплив вставок і вилучень. У другій порівняння послідовностей на слайді, окрім однієї амінокислоти і виключення іншої, показують, що тільки одна амінокислота матчів кислоти у співвідношенні, тим не менш, червоних ліній показують, що більшість амінокислот в дві послідовності, в однаковому порядку. Більш алгоритмічні труднощі виникають, коли ми вважаємо вирівнювання між послідовностями, які не з'являються, щоб бути тісно пов'язані. Як визначити, чи є ці послідовності насправді пов'язано? Цілком можливо, що вирівнювання сталося випадково і не вказують на значне біологічне споріднення.

15. Методи вирівнювання послідовності

Графічні методи

Динамічне програмування методів

евристичні методи

Алгоритми справу зі складностями вирівнювання послідовності можуть бути згруповані в три категорії: графічні методи динамічного програмування методи і евристичні методи. Графічний підходи забезпечують способи для людей, щоб візуально оцінити тип і якість послідовності вирівнювання. Динамічні методи програмування може бути математично довів забезпечити найкращу послідовність узгодження, але часто вимагають занадто багато комп'ютерної обробки. Практичні міркування Тому привело до розробки евристичних алгоритмів, які зазвичай (але не завжди) забезпечують оптимальні результати та виконати набагато швидше, ніж динамічні методи програмування.

16. Матричний аналіз

Графічний метод

Показує все можливе вирівнювання

застереження

Деякі здогади у виборі параметрів

розмір вікна

строгість

Не настільки суворих кількісних або інших методів

Матричний аналіз є графічний метод, який відображає все можливе вирівнювання між двома нуклеотидних або амінокислотних послідовностей. Прогалини та вставки не впливає на ефективність цього методу. Наприклад, в слайд використовує послідовність порівнянні з попередньому слайді. Червоні коробки в матриці на слайд-шоу аміно кислоти матчі між двома послідовностями. Довга рядок червоні коробки показує, що дві послідовності, безумовно, пов'язані між собою. Жовта діагональна на матриці вказується коробки, яка була б червона була першою 10 амінокислот з двох послідовностей були ідентичні. При діагональної червоної коробки зміщується від жовтої лінії, наявність вставок (або видалення) вказується. У порівнянні з іншими методами вирівнювання послідовностей, матричний аналіз є менш суворим і вимагає деяких припущень з боку користувачів, щоб вибрати такі параметри, як розмір вікна і жорсткості.

17. Матричний аналіз: реальний приклад

Цифри, наведені в цьому слайд-шоу реальні приклади аналізу матричних. Розмір вікна посилається на шматки послідовності, які будуть порівнюватися одночасно. Жорсткість встановлює мінімальну кількість амінокислотної або нуклеотидної матчів в кожному вікні, яке необхідно для матчу повинні бути записані у матричному аналізі. На слайді, дві послідовності, які є близько 800 нуклеотидів, спочатку в порівнянні з розміром вікна 1 і жорсткості 1. Це порівняння результатів в безлад, що не може бути витлумачено, однак, коли розмір вікна встановлено в 23 і жорсткості до 15, дуже чітке вирівнювання стає очевидним в правий нижній квадрант матриці.

18. Розробка системи балів

Підрахунок матриці дозволяють біологам для кількісної оцінки якості вирівнювання послідовності

Використання різних матриць скорингу для різних цілей

Оцінка для аналогічних структурних доменів в білках

Оцінка для еволюційних відносин

Деякі популярні матриці скоринг

PAM для еволюційних досліджень

BLOSUM для знаходження спільних мотивів

Решта методи для вирівнювання послідовності вимагає методів оцінки для кількісної оцінки якості послідовності вирівнювання. Цей аналіз необхідний, якщо шукає найкраще вирівнювання. Для виконання цієї функції, обчислювальні біологи розробили забив матриці, які створюються за допомогою статистики від реальних нуклеотидних та амінокислотних послідовностей. Різні матриці скоринг використовують для різних цілей. Наприклад, PAM (у відсотках Прийнято мутації) матриць скорингу використовується в еволюційних дослідженнях, і BLOSUM (блоків амінокислот Заміна матриці кислоти) матриць скоринг використовується при пошуку загальних функціональних мотивів у білках. На наступному слайді показаний приклад того, як забив матриця працює.