Неконтрольована методи

Не робіть припущень про те, як повинні поводитися дані

Кластер генів на основі аналогічних моделей експресії генів

приклади

ієрархічна кластеризація

Аналіз головних компонент (PCA)

Алгоритми, що використовуються для аналізу поведінки безлічі генів діляться на дві великі категорії: контрольовані та неконтрольовані. Рішення про використання того чи іншого залежить від характеру наукового питання. Наприклад, біолог, можливо, мало інтуїції про те, що моделі експресії генів з'явиться в зразку тканини раку молочної залози. Неконтрольованого алгоритм кластеризації дозволило б йому або їй, щоб згрупувати різні набори генів на основі тільки їх експресії генів. Неконтрольований метод може виявити кілька кластерів генів на основі того, як корельовані їх рівні експресії генів знаходяться в різних зразків тканини від хворих на рак молочної залози. Схематизованих в слайді наведено два приклади неконтрольованої техніки: ієрархічної кластеризації (розглядається в главі Pharmacogenomics) і більш складний статистичний метод аналізу головних компонент (PCA). Озброївшись цими результатами, дослідник може потім дивуються, якщо конкретна картина експресії генів можуть бути використані в діагностиці та прогнозі захворювання. Щоб визначити, якщо це може бути зроблено, охоронювана методи необхідні. Ці методи передбачають, що мікрочіп дані містять достатньо інформації, щоб розрізняти зразки умовах. Контрольований методів тому прагнемо знайти оптимальне моделей експресії генів, які вказують на особливий стан зразка. Наприклад, з використанням шаблонів експресії генів розрізняти різні типи ракових тканин може призвести до діагностики конкретних форм раку, які могли б бути важко відрізнити використанням традиційних методів. Крім того, зразки тканин, отриманих від раку у пацієнтів з різним рівнем смертності можуть бути використані для розробки підпис експресії генів свідчить про хорошою чи поганою прогноз. Приклади цих типів додатків мікрочіпів наведені в "Pharmacogenomics» і «геноміка і медицина» глав. Однак, перш ніж контрольованого або неконтрольованого методи можуть бути використані, методи необхідні для вимірювання відмінностей в експресії генів між окремими генами.

39. Метрики для експресії гена Metrics for gene expression

Потрібен метод вимірювання, як аналогічні гени на основі виразу

приклади

евклідова відстань

Коефіцієнт кореляції Пірсона

Ряд заходів (показників) доступні для виділення генів на основі рівня їх експресії генів. Два з них показані на слайді. Вимірювання евклідова відстань починається з графом, в якому осі представляють собою рівні експресії в різних зразках. Хоча люди можуть тільки візуалізувати трьох вимірах, відстань між двома генами представляють точок на графіку може бути виміряна для будь-якої кількості зразків. Евклідова відстань між двома генами, які виражаються в двох зразках тканин представлені червона лінія на слайді. Іншою популярною заходом є коефіцієнт кореляції Пірсона. У цьому випадку осі рівні експресії генів для двох різних генів і точки на графіку представляють окремі зразки тканин. Лінійної регресії, проведеної через точки і відстані між окремими точками і лінія використовується для розрахунку коефіцієнта кореляції Пірсона, який може приймати будь-які значення від -1 до +1. Величина коефіцієнта являє силу відносин між двома генами, а знак вказує, чи є два гени негативно або позитивно корелюють. Наприклад, гени, які негативно корелює з їх рівнями експресії генів б показати картини, де підвищена експресія гена в одній відзначено зниження експресії в інший. Хоча багато показників для експресії гена існує, є застереження, пов'язані з кожним. Наприклад, розрахунок коефіцієнта кореляції Пірсона може бути порушена наявністю викидів. Тим не менш, велике розуміння був отриманий шляхом застосування метрик експресії генів у неконтрольовані та контрольовані методи.