ТВОРЧЕСТВО

ПОЗНАНИЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 

Сорок лет прожив во Франции, он так и не привык к ним – по той причине, что в русском языке их заменяют другие вспомогательные слова.
Такие соображения привели меня лет десять назад к идее одного эксперимента (если его можно так назвать). Я взял английский текст (первую главу из общеизвестной книги Д. К. Джерома «Трое в одной лодке…») и на досуге выписал из нее все слова, определив частоту их встречаемости. А затем построил график, аналогичный кривой кинетики реассоциации ДНК – только вместо c0t взял частоту встречаемости слов в тексте.
Получилась довольно наглядная кривая, которую коллеги принимали именно за этот образец. Четко выделились высокоповторяющиеся последовательности (the, a, an, to), средние повторы (in, on, into, – ing). И, наконец, уникальные. Туда же попал и Монморенси – ведь кличка знаменитого фокстерьера встречается в первой главе только один раз.
Почему я взял англоязычный текст? С ним легче работать, легче отстраниться. Сейчас я думаю, что русскоязычный дал бы еще более четкую картину – за счет флексий. Человек, владеющий персональным компьютером, был бы способен на анализ более протяженных и сложных текстов, и аналогия выступила бы еще нагляднее.
Повторяю, аналогия не доказательство, а лишь повод для выдвижения гипотезы (или спекуляции, если хотите). Структурный ген, кодирующий белок, – это только корень слова. Он обретает смысл лишь при взаимодействии с другими последовательностями, которые играют роль вспомогательных слов в языке. Вирусы и отчасти бактерии практически не имеют повторов в своих простых геномах. Их «язык» напоминает, если хотите, тот язык, на котором говорил Тарзан в некогда популярных фильмах. Но закодировать на нем достаточно большой объем информации о построении сложного фенотипа невозможно.
Опираясь на этот нехитрый эксперимент, я мог уже целеустремленно искать в литературе сведения о функциональной роли повторяющихся последовательностей и тех механизмах, которые обеспечивают помехоустойчивость генетических сообщений.
Но это уже другой вопрос, тема следующей главы. До сих пор мы говорили о статике, о структуре генетических сообщений. В следующей главе придется говорить и о динамике, об эволюции генетических текстов – начиная с момента происхождения жизни.
В заключение хочу оговориться. Я отнюдь не считаю все последовательности ДНК функционально значимыми. Подобно тому, как все организмы имеют так называемые рудиментарные органы, ныне бесполезные, но свидетельствующие об их истории, так и их геномы могут содержать реликтовые последовательности, гены-рудименты, не играющие сейчас никакой роли или очень мало значимые. Все дело в количественной оценке феномена. Не только 96%, но и 30% ДНК «мусорной» и «эгоистической» в процессе эволюции в геноме не удержится.
А сейчас перейдем к третьей главе. В начале ее нужно обсудить вопрос: нужен ли господь бог для синтеза первого гена или же, как сказал Лаплас Наполеону, можно обойтись без этой гипотезы?
Глава III.
Есть ли жизнь на Земле?
Оро:…Как сказал один шутник, по теории вероятностей мы все должны были быть мертвецами. Тем не менее, мы живы.
Чаргафф: Но мы все-таки умрем.
Мора: В том-то и беда.
Из дискуссии на Флоридской конференции по происхождению жизни

Там, где вечно дремлет тайна,
Есть нездешние поля.
Только гость я, гость случайный
На горах твоих, земля.
Сергей Есенин
В прошлой главе мы пришли к выводу, что так называемые структурные гены, кодирующие аминокислотные последовательности белков – это лишь, если угодно, корни слов, но не сами слова и тем более не осмысленные предложения. Тем самым вопрос о «лищней» ДНК в значительной мере снимается. Если же мы учтем, что в передаче информации по каналу с высоким уровнем шума код должен быть помехоустойчивым, становится ясной та непонятная щедрость природы, с которой она наделила ДНК наши клеточные ядра. Это не исключает возможности существования в геноме своего рода реликтовых последовательностей, не несущих в настоящее время определенной функции («гены на пенсии или в творческом отпуске»). Но доля их в геноме не может быть значительной, они не должны мешать генам активным, ибо довлеет дневи злоба его.
На уровне построения фенотипа (клеток, тканей, органов) также существуют структуры, для организма в данный период эволюции бесполезные (рудиментарные органы вроде зачаточных тазовых костей у китов и удавов, мышцы, двигающие ушной раковиной у человека, человеческий аппендикс и многое другое).
Аналогичная картина наблюдается и в мемофондах. Мы знаем лишние буквы в алфавите и слова в языках, рудименты старых технологий, обычаев и идеологий. Простой пример: раньше обшлага камзолов отворачивались и пристегивались на пуговицы. Теперь этого нет, но на рукавах каждого пиджака с упорством, достойным лучшего применения, пришивают по три пуговицы. Не столь уж безобидный рудимент, хотя бы для нашей страны. Сколько пиджаков в РФ, статистика не знает, как не знает и числа стульев. Допустим, что каждый гражданин мужского пола имеет хотя бы один пиджак (140 млн.). Это соответствует 840 млн. пуговиц, которые ничего не пристегивают. Без малого миллиард, а ведь это пример безобиднейшего реликта. Несравненно больше вреда «пуговицы на обшлагах» приносят не в технологиях, а в самых консервативных областях мемофондов – обычаях, обрядах, идеологиях. Но об этом у нас еще будет время поговорить.
Сейчас рассмотрим несколько иной аспект проблемы. Существуют ли какие-нибудь связи в последовательности нуклео-тидов – в нуклеотидном «тексте»? И опять начнем с аналогии – рассмотрим лингвистические тексты.
Как вы помните, энтропия на символ русского текста около 5 бит, но при условии, что все буквы одинаково вероятны. Такой текст можно получить, если 32 буквы кириллицы (без различения букв е и ё, ь и ъ, как на телеграфе) написать на бумажках, а затем вытаскивать их из урны, записывать вытянутый символ и возвращать бумажку обратно. Сначала я хотел сделать это сам, но потом решил воспользоваться моделью Р. Л. Добрушина (его примеры цитируются в ряде книг). Вот какая фраза у него получилась:

сухерробьдщяыхвщиюайжтлфвнзагфоенвштцр хгбкучтжюряпчькйхрыс (1)
Как видите, получилось нечто такое, что нельзя и выговорить. Именно такой текст и содержит 5 бит/символ, он наиболее информативен, потому что вероятность появления каждого последующего знака определяется только случаем и всегда равна 1/32. Но мы-то знаем, что в русском тексте разные буквы встречаются с разной частотой. Чаще всего встречается буква «о» (частота 0,090.), но это только в письменной речи. В устной, в московском говоре, где безударное «о» выговаривается как «а» («с Масквы, с пасада, с калашнава ряда»), положение другое.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22