Геном рыбы фугу примерно в восемь раз меньше, чем геном человека, и в 330 раз меньше, чем геном двоякодышащей рыбы протоптер. Какие «призраки» живут на «кладбищах геномов», и сколько мусора в нашей с вами ДНК?
Александр Панчин
Сколько мусора в нашей ДНК?

Известный молекулярный биолог Дэвид Пенни из Центра молекулярной экологии и эволюции Аллена Вилсона в новозеландском Университете Массей как-то сказал: «Я бы весьма гордился работой в группе, которая разработала геном кишечной палочки. Однако я бы никогда не признался, что участвовал в проектировании генома человека. Ни в одном университете этот проект не смогли бы настолько испортить». Тема о количестве мусора в нашей ДНК — одна из самых «горячих» тем в научном сообществе. Вокруг этого вопроса среди ученых разгораются настоящие словесные баталии.

Репликация (от лат. replicatio — возобновление) — процесс синтеза дочерней молекулы дезоксирибонуклеиновой кислоты на матрице родительской. При следующем за этим делении каждая из дочерних клеток получает по одной копии молекулы ДНК, идентичной ДНК исходной материнской клетки. Репликацию ДНК осуществляет реплисома — сложный ферментный комплекс, состоящий из 15−20 различных белков.

Немного молекулярной генетики

Напомним, что в основе передачи наследственной информации лежит двухцепочечная молекула ДНК. Она представляет собой полимер из четырех типов мономеров (нуклеотидов): аденина (A), тимина (T), цитозина (С) и гуанина (G) — и уложена в хромосомы. У человека 23 пары расположенных в ядре хромосом (22 пары неполовых и одна пара половых). Они и составляют основу нашего генома (еще 37 генов содержат кольцевые ДНК митохондрий). Если бы мы взяли одну клетку человека, сшили весь диплоидный (парный) набор хромосом вместе и вытянули в нить, то получили бы молекулу длиной в два метра, состоящую из шести миллиардов пар оснований (нуклеотидов). Три миллиарда от папы и три — от мамы.

Геномы и гены Геномы и гены Плодовая муха дрозофила Drosophila melanogaster. Геном модельной мухи. Геном: 120 млн пар оснований. Генов: 13 500.

Наиболее изученный тип функциональных последовательностей ДНК — гены, кодирующие белки. С таких генов считывается молекула РНК, которая затем играет роль матрицы для синтеза белков и определяет их аминокислотную последовательность. Кодирующая часть молекулы РНК может быть разделена на тройки нуклеотидов (кодоны), которые либо соответствуют некоторой аминокислоте, либо определяют место окончания синтеза белка (стоп-кодоны). Правило соответствия кодонов аминокислотам называется генетическим кодом. Например, кодон GCC кодирует аминокислоту аланин.

Частично синтетическая бактерия Mycoplasma laboratorium. Синтетический геном, в котором закодированы имена синтезировавших его ученых. Геном: 580 000 пар оснований. Генов: 381.

Померимся генами?

Когда-то думали, что у столь сложного организма, как человек, должно быть очень много генов. Когда проект «Геном человека» подходил к завершению, ученые даже устроили тотализатор: сколько генов будет обнаружено? Каково же было их удивление, когда оказалось, что количество генов у человека и маленького круглого червя Caenorhabditis elegans примерно одинаковое. У червяка около 20 000 генов, а у нас — 20−25 тысяч. Для «венца творения» факт довольно обидный, особенно если учесть, что существует много организмов как с бОльшим по размеру геномом (геном двоякодышащей рыбы протоптер, Protopterus aethiopicus, в 40 раз больше человеческого), так и с бОльшим количеством генов (у риса — 32−50 тысяч генов).

Свободноживущая нематода Caenorhabditis elegans. Маленький модельный геном животного. Геном: 100 млн пар оснований. Генов: ~20 000.

Но на самом деле у человека менее 2% генома кодируют какие-либо белки. Для чего же нужны остальные 98%? Может, там скрывается секрет нашей сложности? Оказалось, что существуют важные некодирующие участки ДНК. Например, это участки промоторов — последовательностей нуклеотидов, на которые садится фермент РНК-полимераза и откуда начинается синтез молекулы РНК. Это участки связывания транскрипционных факторов — белков, регулирующих работу генов. Это теломеры, защищающие концы хромосом, и центромеры, необходимые для правильного расхождения хромосом по разным полюсам клеток при делении. Известны некоторые регуляторные молекулы РНК (например, микроРНК, препятствующие синтезу белков соответствующих генов на матричной РНК — копии гена-исходника), а также молекулы РНК, входящие в состав важных ферментативных комплексов — например, рибосом, которые собирают из отдельных аминокислот белки, передвигаясь по матричной РНК. Есть и другие примеры важных некодирующих участков ДНК.

Резуховидка Таля Arabidopsis thaliana. Маленький модельный растительный геном. Геном: 119 млн пар оснований. Генов: ~25 000.

Тем не менее бОльшая часть нашего генома напоминает пустыню: повторяющиеся последовательности, останки «мертвых» вирусов, которые когда-то давно встраивались в геномы наших предков; так называемые эгоистичные мобильные элементы — последовательности ДНК, способные перескакивать из одного участка генома в другой; различные псевдогены — нуклеотидные последовательности, утратившие способность кодировать белки в результате мутаций, но все еще сохранившие некоторые признаки генов. Это далеко не полный список «призраков», обитающих на «кладбище генома».


Вдвое умнее мух

Идея тотализатора по поводу числа человеческих генов пришла в голову доктору Эвану Бирни в баре при лаборатории в Колд-Спринг-Харбор незадолго до завершения проекта «Геном человека». По мере приближения к финалу, с 2000 по 2002 год, ставки выросли с 1 доллара до 20. В результате банк разделили «на троих»: Пол Дир из Британского совета по медицинским исследованиям, который еще в 2000 году поставил на дату своего рождения — 27.04.1962 — 27 462, Ли Роуэн из Института системной биологии в Сиэтле — в 2001 году она поставила на число 25 947, и Оливер Джейлон из французской компании Genoscope (26 500). Когда главного победителя — доктора Дира — спросили, как ему удалось еще три года назад, когда все думали, что генов у человека не меньше 50 000, угадать число с такой точностью, он ответил: «Дело было в баре, глубокой ночью. Наблюдая за поведением пьющих людей, я подумал, что оно мало отличается от поведения мух-дрозофил, у которых 13500 генов, а потому мне показалось, что удвоенного числа мушиных генов людям вполне достаточно».

Минимальная мышь

Существует точка зрения, что бОльшая часть генома человека нефункциональна. В 2004 году журнал Nature опубликовал статью, описывавшую мышей, из генома которых были вырезаны значительные фрагменты некодирующей ДНК размером в 0,8 и даже 1,5 млн нуклеотидов. Было показано, что эти мыши не отличаются от обычных строением тела, развитием, продолжительностью жизни или способностью оставлять потомство. Разумеется, какие-то отличия могли остаться незамеченными, но в целом это был серьезный аргумент в пользу существования «мусорной ДНК», от которой можно избавиться без особых последствий. Конечно, было бы интересно вырезать не пару миллионов нуклеотидов, а миллиард, оставив только предсказанные последовательности генов и известные функциональные элементы. Удастся ли вывести подобную «минимальную мышь», и сможет ли она нормально существовать? Может ли человек обойтись геномом длиной лишь в полметра? Возможно, когда-нибудь мы об этом узнаем. Тем временем еще один важный аргумент в пользу существования мусорной ДНК — наличие достаточно близких организмов с очень разными размерами геномов. Геном рыбы фугу примерно в восемь раз меньше, чем геном человека (хотя генов в нем примерно столько же), и в 330 раз меньше, чем геном уже упомянутой рыбы протоптер. Если бы каждый нуклеотид в геноме был функционален, то непонятно, зачем луку геном в пять раз больший, чем у нас?

На колоссальные различия в размерах геномов сходных организмов обратил внимание эволюционный биолог Сусуму Оно. Считается, что именно Оно ввел термин «мусорная ДНК» (junk DNA). Еще в 1972 году, задолго до того, как был прочитан геном человека, Оно высказал правдоподобные представления как о количестве генов в геноме человека, так и о количестве «мусора» в нем. В своей статье «Столько мусорной ДНК в нашем геноме» он отмечает, что в геноме человека должно быть около 30000 генов. Это число, на тот момент совсем не очевидное, оказалось удивительно близко к реальному, которое узнали десятки лет спустя. Кроме того, Оно приводит оценку функциональной доли генома (6%), объявляя более 90% генома человека мусором.

Мимивирус Acanthamoeba polyphaga mimivirus. Самый большой известный геном вируса. Геном: 1 181 404 пар оснований. Генов: 979.

Находка или мусор?

Вызов представлению о существовании мусорной ДНК бросил проект ENCODE — The Encyclopedia of DNA Elements, «Энциклопедия элементов ДНК» (первые его результаты опубликованы в журнале Nature в 2012 году). Получив многочисленные экспериментальные данные о том, какие части генома человека взаимодействуют с различными белками, участвуют в транскрипции — синтезе РНК-копий генов для последующей трансляции (синтеза белка из аминокислот на матрице информационной РНК) — или других биохимических процессах, авторы пришли к выводу, что более 80% генома человека так или иначе функциональны. Разумеется, данный тезис вызвал бурное обсуждение в научном сообществе.

Двоякодышащая рыба протоптер Protopterus aethiopicus. Самый большой известный геном. Геном: 133 млрд пар оснований. Генов: много.

Одна из наиболее ироничных статей, опубликованная Дэном Грауром, специалистом по молекулярной эволюционной биоинформатике, профессором Хьюстонского университета, и его коллегами в 2013 году в журнале Genome biology and evolution, называется так: «О бессмертии телевизоров: «функция» в геноме человека по лишенному эволюции Евангелию от ENCODE». Ее авторы отмечают, что отдельные члены консорциума ENCODE расходятся в том, какая часть генома функциональна. Так, один из них вскоре уточнил в журнале Genomicron, что речь идет не о 80% функциональных последовательностей в геноме, а о 40%, а другой (в статье в Scientific American) и вовсе снизил показатель до 20%, но при этом продолжал настаивать, что термин «мусорная ДНК» нужно устранить из лексикона.

Вирус иммунодефицита человека (ВИЧ). Быстро меняющийся геном вируса иммунодефицита человека. Геном: 9749 пар оснований (но уже мутировал). Генов: 9, но они кодируют 18 белков.

По мнению авторов статьи «О бессмертии телевизоров», члены консорциума ENCODE слишком вольно интерпретируют термин «функция». Например, существуют белки, которые называют гистонами. Они могут связывать молекулу ДНК и помогают ей компактно укладываться. Гистоны могут подвергаться определенным химическим модификациям. Согласно ENCODE, предположительная функция одной из таких модификаций гистонов — «предпочтение находиться в 5'-конце генов» (5'-конец — это конец гена, от которого движутся ферменты ДНК- и РНК-полимеразы при копировании ДНК или при транскрипции). «Примерно так же можно сказать, что функция Белого дома — занимать площадь земли по адресу 1600, Пенсильвания-авеню, Вашингтон, округ Колумбия», — отмечают оппоненты.


Каша ехала на мотоцикле

Иногда в СМИ можно услышать некорректную фразу «генетический код мутировал». Но мутации происходят не в коде, а в молекуле ДНК (в геноме). В результате меняются нуклеотидные последовательности. Это можно сравнить с заменой буквы в слове. Например, фраза «Маша ехала на мотоцикле» превращается во фразу «Саша ехала на мотоцикле», если одна буква М «мутировала» в букву С. Изменение генетического кода намного серьезней — это как изменение алфавита. Представим, что во всем тексте буква М внезапно превратилась в букву К. Теперь у нас «Каша ехала на котоцикле». Понятно, что такие изменения приводят к значительным последствиям и поэтому в природе происходят крайне редко. Но происходят! Например, у некоторых инфузорий один из стоп-кодонов может кодировать аминокислоту глутамин. Но это скорее исключение, чем правило. У большинства организмов один и тот же генетический код: например, у человека, у червяка или огурца. А вот геномы у этих организмов различаются очень сильно. Тот же алфавит, но другой текст.

Возникает проблема и с приписыванием функции участкам ДНК. Предположим, что к определенному участку ДНК способен прикрепляться важный для функционирования клетки белок, и поэтому ENCODE приписывает этому участку «функцию». Например, некоторый транскрипционный фактор — белок, инициирующий синтез информационной (матричной) РНК — связывается со следующей последовательностью нуклеотидов: TATAAA. Рассмотрим две идентичные последовательности TATAAA в разных частях генома. После того как транскрипционный фактор связывается с первой последовательностью, начинается синтез молекулы РНК, служащей матрицей для синтеза другого важного белка. Мутации (замены любого из нуклеотидов) в этой последовательности приведут к тому, что РНК будет считываться плохо, белок не будет синтезирован, и это, скорее всего, негативно скажется на выживании организма. Поэтому правильная последовательность TATAAA будет поддерживаться в данном месте генома с помощью естественного отбора, и в этом случае уместно говорить о наличии у нее функции.

Рыба фугу Fugu rubripes. Самый маленький известный геном позвоночного. Геном: 390 млн пар оснований. Генов: 20−28 тысяч.

Другая последовательность TATAAA возникла в геноме по случайным причинам. Поскольку она идентична первой, с ней тоже связывается транскрипционный фактор. Но никакого гена рядом нет, поэтому связывание ни к чему не приводит. Если в этом участке возникнет мутация, ничего не изменится, организм не пострадает. В данном случае говорить о функции второго участка TATAAA нет смысла. Впрочем, может оказаться, что наличие в геноме большого количества последовательностей TATAAA вдали от генов нужно просто для того, чтобы связывать транскрипционный фактор и уменьшать его эффективную концентрацию. В таком случае отбор будет регулировать число таких последовательностей в геноме.

Лук репчатый Allium cepa. Один из самых больших растительных геномов. Геном: 16 млрд пар оснований. Генов: неизвестно.

Чтобы доказать, что некоторый участок ДНК функционален, недостаточно показать, что в этом участке происходит некий биологический процесс (например, связывание ДНК). Члены консорциума ENCODE пишут, что функцией обладают участки ДНК, которые вовлечены в транскрипцию. «Но почему нужно акцентировать внимание на том, что 74,7% генома транскрибируется, в то время как можно сказать, что 100% генома принимает участие в воспроизводимом биохимическом процессе — репликации!», — снова шутит Граур.

Антарктические бескрылые комары-звонцы Belgica antarctica. Самый маленький геном членистоногих. Геном: 99 млн пар оснований. Генов: ~14 000.

Хорошим критерием функциональности участка ДНК является то, что мутации в нем достаточно вредны и значительные изменения этого участка не наблюдаются из поколения в поколение. Как определить такие участки? Здесь на помощь и приходит биоинформатика, современная наука на стыке биологии и математики об анализе последовательностей генов и белков. Мы можем взять геномы человека и мыши и найти в них все похожие участки ДНК. Окажется, что у этих двух видов какие-то участки последовательностей нуклеотидов очень похожи. Например, гены, необходимые для синтеза рибосомальных белков, довольно консервативны, то есть мутации в них достаточно вредны, чтобы носители новых мутаций вымирали, не оставляя потомства. Про такие гены говорят, что они находятся под отрицательным отбором, очищающим от вредных мутаций. Другие участки геномов будут иметь значительные расхождения между видами, что указывает на то, что мутации в этих участках, скорее всего, безвредны, а значит, их функциональная роль невелика или не определяется конкретной последовательностью нуклеотидов. В ряде работ оценили долю участков ДНК человека, находящихся под давлением отрицательного отбора. Оказалось, что к ним относятся только около 6,5−10% генома, причем некодирующие участки, в отличие от кодирующих, гораздо меньше подвержены отрицательному отбору. Получается, что с точки зрения эволюционных критериев функциональны менее 10% генома человека. Обратите внимание, как близок к этой оценке был Оно в 1972 году!

Бактерия Hodgkinia cicadicola. Самый маленький известный геном бактерии. Бактерия-симбионт с нестандартным генетическим кодом. Геном: 144 000 пар оснований. Генов: 189.

Мусорная крепость

Но неужели остальные 90% генома человека — мусор, от которого лучше избавиться? Не совсем так. Есть соображения, что большой размер генома может быть полезен сам по себе. У бактерий репликация генома служит серьезным ограничивающим фактором, требующим значительных затрат энергии. Поэтому их геномы, как правило, маленькие, а от всего лишнего они избавляются. У крупных организмов, как правило, репликация ДНК делящихся клеток вносит не столь большой вклад в общее количество энергозатрат организма на фоне расходов на работу мозга, мышц, органов выделения, поддержания температуры тела и т. д. В то же время большой геном может быть важным источником генетического разнообразия, увеличивая шансы на появление новых функциональных участков из нефункциональных за счет мутаций, потенциально полезных в процессе эволюции. Мобильные элементы могут переносить регуляторные элементы, создавая генетическое разнообразие в регуляции работы генов. То есть организмы с крупными геномами теоретически могут быстрее адаптироваться к условиям среды, расплачиваясь сравнительно небольшими дополнительными затратами на репликацию более крупного генома. Подобный эффект мы не обнаружим у отдельного организма, но он может играть важную роль на уровне популяции.

Человек разумный Homo sapiens. Геном предположительно на 90% состоит из мусора. Геном: 3 млрд пар оснований. Генов: 20−25 тысяч.

Наличие крупного генома может также уменьшать вероятность того, что какой-нибудь вирус встроится в функциональный ген (что может привести к поломке гена и в ряде случаев к раку). Иными словами, не исключено, что естественный отбор может действовать не только на поддержание конкретных последовательностей в геноме, но на сохранение определенных размеров генома, нуклеотидного состава в некоторых его участках и т. д.

Впрочем, хотя идея, что только 80% или даже 20% генома человека функциональны — спорна, это вовсе не значит, что критике подлежит весь проект ENCODE. В его рамках получено огромное количество данных о том, как разные белки связываются с ДНК, информации о регуляции генов и т. д. Эти данные представляют большой интерес для специалистов. Но едва ли в ближайшее время удастся избавиться от «мусора» в геноме — как от концепции, так и от самих ненужных последовательностей.

Автор — научный сотрудник сектора молекулярной эволюции ИППИ РАН

Автор благодарит Евгению Дуеву и Юрия Панчина за помощь в написании статьи. Редакция выражает благодарность сайту «Биомолекула».

Статья «Сколько мусора в нашей ДНК?» опубликована в журнале «Популярная механика» (№1, Январь 2015).
Понравилась статья?
Подпишись на новости и будь в курсе самых интересных и полезных новостей.
Спасибо.
Мы отправили на ваш email письмо с подтверждением.