Сложные гены эукариот

Когда исследователи начали изучать гены различных белков в клетках эукариот, обнаружилось, что взаимодействие генов и белков в этих организмах более сложное, чем взаимодействие генов и белков прокариот. Первые примеры такого взаимодействия были получены в 1977 году в лабораториях Филипа Шарпа и Пьера Шамбона. Вместе со своими коллегами они гибридизировали мРНК различных генов с теми ДНК, с которых были сняты эти информационные копии. У бактерий последовательность мРНК идентична последовательности кодирующей цепи ДНК (за исключением того, что место тимина занимает урацил), поэтому структура гибридных молекул была достаточно проста.

Рис. 9.5. Общие принципы синтеза белка. Информационная (матричная) РНК входит в рибосому так, чтобы первые два ее основания могли соединиться с двумя молекулами ами-ноацил-тРНК. К этому участку подходят две аминоацил-тРНК, кодоны, которых комплементарны кодонам мРНК. Затем первая аминокислота соединяется со второй пептидной связью, первая тРНК отсоединяется, и дипептид остается прикрепленным ко второй тРНК. Вместе с тем мРНК сдвигается на следующий «шаг» в рибосоме, после чего к ее третьему кодону может присоединиться третья тРНК. Между второй и третьей аминокислотой образуется пептидная связь, и весь процесс повторяется (обычно несколько сотен раз) до кодона мРНК, означающего остановку, после чего сформированный белок отсоединяется

Но когда под электронным микроскопом были сделаны снимки гибридных молекул генов эукариот, то в них обнаружился ряд петель. Это значит, что мРНКи ДНК имеют не совсем идентичную последовательность, и петли были как раз теми местами, в которых они не могли соединяться. Когда последовательность мРНК сравнили с последовательностью ДНК, стало понятно, что кодирующая последовательность генов в некоторых местах прерывается некодирующей последовательностью, то есть некоторые нуклеотиды не кодируют синтез белка. Впоследствии выяснилось, что это типичная картина для ДНК эукариот. Кодирующая последовательность гена называется эк-зоном, а некодирующая последовательность — ин-троном. Некоторые гены имеют в своей структуре несколько интронов. Часто обнаруживают и такие гены, в которых больше интронов, чем экзонов.

В общем случае при транскрипции генов эукариот образуются большие молекулы РНК, содержащие как экзоны, так и интроны. После этого особые комплексы ферментов (сплайсингсомы) вырезают из транскрипта все интроны и соединяют экзоны в одну мРНК, кодирующую производство белка. Далее эта РНК транслируется как обычно.

Причины, по которым природа придерживается такой структуры, до сих пор не ясны, но ее можно объяснить как с эволюционной точки зрения, так и с точки зрения развития организма. Если говорить об эволюции, то такая структура ценна тем, что позволяет экспериментировать с генами и создавать новые гены. Кроссинговер может происходить внутри интронов, и в таком случае ошибки будут несущественными, а при рекомбинации могут образоваться новые экзоны и как следствие новые белки. Часто бывает так, что отдельный экзон кодирует отдельную область, или домен, белка, то есть отдельную часть белка с особыми функциями. Поэтому включение в ген нового экзона приведет к созданию белка с новыми областями и, возможно, с новыми функциями. Такое изменение генетической структуры может служить источником эволюции.

С точки зрения развития организма структура интрон-экзон ценна тем, что позволяет одноц нуклеотидной последовательности кодировать синтез более одного белка. Сейчас известны случаи, когда интроны в разных тканях режутся по-разному, и в результате синтезируются разные белки с разными функциями. Поэтому такая структура предоставляет возможность осуществить рост новых типов клеток с минимальным изменением информации.

Хромосомы эукариот содержат не только избыточную ДНК в виде интронов, но и повторяющуюся ДНК, которая не кодирует белки или стабильные молекулы РНК. Например, около 10% ДНК мыши приходится на ДНК с высоким содержанием повторяющихся элементов, то есть эти участки содержат короткие последовательности, длиной не более 10 нуклеотидных пар, повторяющихся миллионы раз. Еще 20% приходится на ДНК с умеренным содержанием повторяющихся элементов, то есть эти участки содержат последовательности из нескольких сотен нуклеотидов, повторяющиеся тысячи раз. Таким образом, очень большая часть хромосом эукариот состоит из ДНК, которая может подвергаться мутациям и рекомбинациям без выраженного эффекта. (О повторяющейся ДНК в геноме человека говорится в гл. 12.)

Генетический словарь

К 1962 году благодаря работам Крика и его коллег, о которых говорилось ранее, было установлено, что генетический код состоит из триплетов. После этого перед исследователями встала другая непростая задача: определить, какие именно аминокислоты кодирует тот или иной триплет. Как часто бывает, открытие было сделано почти случайно, после чего весь код был расшифрован за несколько лет — одно из величайших достижений молекулярной биологии! В 1961 году Маршалл Ниренберг и Филипп Ледер разрабатывали методы искусственного синтеза белка, смешивая рибосомы, источники энергии, активирующие ферменты, тРНК и другие компоненты. В одну из контрольных смесей, синтез белка, в которой не ожидался, они добавили искусственную РНК, состоявшую исключительно из ураци-ла, то есть полимера с нуклеотидной последовательностью U—U—U—U—U-, называемого полиури-диловой кислотой. Вопреки ожиданиям эта кислота повела себя, как информационная РНК, и стимулировала синтез белка. В такой среде с полиуридило-вой кислотой синтезировался только полифенил-аланин, то есть последовательность U—U— U должна была кодировать производство одной аминокислоты, а именно фенилаланина.

После этого открытия началось настоящее состязание между лабораториями Ниренберга и Северо Очоа, в которых с помощью синтетических РНК старались подобрать код к каждой аминокислоте. Поскольку фермент, создающий такие синтетические молекулы, соединяет основания в случайной последовательности, поначалу приходилось полагаться на статистический анализ получающихся полипептидов. Настоящий прорыв был сделан только тогда, когда Ниренберг и Генрих Матей попытались синтезировать мини-мРНК с тремя нуклеотидами в известной последовательности. Обнаружилось, что в искусственной среде каждый из этих триплетов присоединялся к рибосоме и распознавался только одним видом тРНК. Исходя из этого, легко было узнать, какие аминокислоты кодировались тем или иным триплетом. Исследователи выяснили, что UUU и UUC (если читать их в направлении 5→3'), например, присоединяют к себе тРНК фенилаланина, GUU — тРНК валина, UUG — тРНК лейцина, a UGU присоединяет тРНК цистеина. В конце концов с помощью ученых из других лабораторий был расшифрован генетический код всех аминокислот и получен своеобразный «генетический словарь» (табл. 9.1).

На основании приведенной таблицы можно сделать ряд выводов. Как и предсказывал Крик, код оказался вырожденным, но при этом количество кодонов, определяющих ту или иную аминокислоту, варьируется от одного (метионин, триптофан) до шести (лейцин, серии, аргинин). Кроме того, вырожденность кода довольно регулярна. В любом случае весь смысл определяют два первых основания (в направлении 5'→3').

Примечание. Каждый из 64 триплетов либо кодирует одну из aivfti-нокислот (обозначенных трехбуквенными сокращениями), либо означает конец синтеза полипептидной цепи.

В восьми случаях не имеет значения, какое за ними следует третье основание, так как аминокислота определяется и без него. В 12 случаях смысл определяет выбор между пурином (A, G) или пиримидином (U, С).

Триплет AUG, кодирующий метионин, в начале гена почти всегда используется для специальной тРНК, переносящей метионин с блокированной аминогруппой (N-формилметионин). В другие места белка метионин переносит другая тРНК.