Генетика человека. Цели, задачи, проблемы медицинской генетики

Геном человека — это геном биологического вида Homo sapiens. В нормальной ситуации в большинстве клеток человека должно присутствовать 46 хромосом: 44 из них не зависят от пола (аутосомные хромосомы), а две — X-хромосома и Y-хромосома — определяют пол (XY — у мужчин или ХХ — у женщин). Хромосомы в общей сложности содержат приблизительно 3 миллиарда пар оснований нуклеотидов ДНК, в которых по оценкам содержится 20000-25000 генов. [1] В ходе выполнения проекта «Геном человека» содержимое хромосом находящихся в стадии интерфаза в клеточном ядре (вещество эухроматин) было выписано в виде последовательности символов. В настоящее время эта последовательность активно используется по всему миру в биомедицине. В ходе исследований выяснилось, что человеческий геном содержит значительно меньшее число генов, нежели ожидалось в начале проекта. Только для 1,5 % всего материала удалось выяснить функцию, остальная часть составляет так называемую мусорную ДНК. [2] В эти 1,5 % входят собственно сами гены, которые кодируют РНК и белки, а также их регуляторные последовательности, интроны и, возможно, псевдогены).

Человеческий геном состоит из 23 пар хромосом (46 суммарно), где каждая хромосома содержит сотни генов разделённых межгенным пространством. Межгенное пространство содержит регуляторные участки и ничего не кодирующую ДНК.

В геноме присутствует 24 различных хромосомы: 22 из них не влияют на пол, а две хромосомы (X и Y) задают пол. Хромосомы с 1-ой по 22-ую пронумерованы в порядке уменьшения их размера. Соматические клетки обычно имеют 23 хромосомных пары: по одной копии хромосом с 1-ой по 22-ую от каждого родителя соответственно, а также X хромосому от матери и Y или X хромосому от отца. В общей сложности получается, что в соматической клетке содержится 46 хромосом.

По оценкам в человеческом геноме около 22,000 генов, кодирующих белок. Начальная оценка была более чем 100 тысяч генов. В связи с усовершенствованием методов поиска генов (предсказание генов) предполагается дальнейшее уменьшение числа генов.

Интересно, что число генов человека не намного превосходит число генов у более простых модельных организмов, например, нематоды Caenorhabditis и дрозофилы. Так происходит из за того, что в человеческом геноме широко представлен альтернативный сплайсинг. Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны, и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.

Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бандами (полосы поперёк хромосомы, которые видно в микроскоп) и с CG-богатыми участками. В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.

Кроме кодирующих белок генов человеческий геном содержит тысячи РНК-генов, включая транспортную РНК (tRNA), рибосомную РНК, микро РНК (microRNA) и прочие не кодирующие белок РНК последовательности.

В человеческом геноме найдено множество различных последовательностей, отвечающих за регуляцию гена. Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.

Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно некоторой гипотезе, в эволюционном дереве ветвь разделяющая человека и мышь появилась приблизительно 70-90 миллионов лет назад [4]. Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности идентичные или очень слабо отличающиеся в сравниваемых геномах) в не кодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов для обоих организмов.

Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу. Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8-раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов.

Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома [2]. Не учитывая известные регуляторные последовательности в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, на текущий момент не выяснена. Фактически эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:

- повторы

- парные повторы

- ДНК спутники (сателлиты)

- миниспутники

- микроспутники

- разбросанные повторы

- SINE-ы (short interspersed nuclear element)

- LINE-ы (long interspersed nuclear element)

- транспозоны

- Ретротранспозоны

- LTR-ы (long terminal repeat)

- Ty1-copia

- Ty3-gypsy

- Не LTR-ы

- ДНК транспозоны

- псевдогены

Представленная классификация не является исчерпывающей. Большая часть объектов вообще не классифицирована мировой научной общественностью на текущий момент.

Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и на эти участки генома многие ссылаются как на «мусорную ДНК». Однако существует масса свидетельств, которая говорит о том, что эти объекты обладают некоторой функцией, которая не вполне понятна на текущий момент.

Псевдогены. Эксперименты с микромассивами ДНК показали, что достаточно серьёзный объём участков генома, не являющихся генами, вовлечён в процесс транскрипции.