ТВОРЧЕСТВО

ПОЗНАНИЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 

– Обратите внимание, что последовательность состоит из четырех основных соединений – аденина, тимина, гуанина, цитозина. В этом участке ДНК, вероятно, содержатся указания, как создать молекулы белка, например, гормона или фермента. Полная молекула ДНК содержит три миллиона таких оснований. Если каждую секунду на этом экране в течение восьми часов в день будет появляться новая таблица, на то, чтобы увидеть полную цепочку ДНК у нас уйдет два года. Вот какие у нее размеры.
– Вот вам типичный пример, – он показал на экран, – поскольку здесь в строке 1201 цепочка содержит ошибку. ДНК, которую мы получаем, как правило бывает в виде отдельных фрагментов или неполной. Поэтому мы начинаем с того, что как бы чиним ее, вернее, этим занимается компьютер. Он перережет цепочку ДНК, используя так называемые рестрикционные ферменты. Компьютер выбирает целую группу различных ферментов, которые и выполняют поставленную задачу.
1 GCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGC
61 GCTGGCGAAACCGGACRGGACTATAAAGATACCAGCTTTCCCCCTGCAAGCTCCCTCGNN
tp04
121 TGTTCCGACCCTGCCGCTTACCGGATACCTGTCCCCCTTTCTCCCTTCGGGAAGCGTGGC
181 TGCTCACGCTGTAGGTATCTCAGTTCGGTGTACGTCGTTCGCTCCAACCTGGGCTGTCTG
BronUY
241 CCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAA
301 AGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTCGGCGACGACCCCTTTCGCTCGAG
434Dnxl AoUBa
361 ATCCGCCTGTCGCTTGCGGTATTCGGAATCTTCCACGCCCTCGCTCAAGCCTTCGTCACT
421 CCAAACCTTTCGGCGAGAAGCAGGCCATTATCGCCGGCATGGCGGCCGACGCGCTGGGCT
481 GCCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATGATTCTTCTCGCTTCCGGCGG
541 CCCGCGTTGAGGCCATGCTGTCCAGGCAGGTAGATGACGACCATCAGGGACAGCCTTCAA
601 CGGCTCTTACCACCCTAACTTCGATCACTGGACCGCTGATCGTCACGGCGATTTATCCCG
Nsp04
661 CACATGGACGCCTTGCTGGCGTTTTTCCATAGCCTCCGCCCCCCTCACGAGCATCACAAA
721 CAAGTCAGAGGTGGCGAAACCCCACAGGACTATAAAGATACCACGCGTTTCCCCCTGGAA
924Caolll DinoLdn
781 GCGCTCCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCTTCGGG
841 CTTTCTCAATCCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCCCTCCAAGCTG
901 ACGAACCCCCGTTCAGCCCGACCCCTGCGCCTGTATCCGGTAACTATCGTCTTGAGTCCA
961 ACACGACTTAACCGGGTTGGCATGGATTGTAGGCGCCGCCCTATACCTTGTCTGCCTCCC
1021 GCGGTGCATCGAGCCGGGCCACCTCGACCTGAATGGAAGCCGGCGGCACCTCGCTAACGG
1081 CCAAGAATTGGAGCCAATCAATTCTTGCGGAGAACTGTGAATGCGCAAACCAACCCTTGG
1141 CCATCGCGTCCGCCATCTCCAGCAGCCGCACGCGGCGCATCTCGGGCAGCCTTGGGTCCT
1416DnxTl
SSpd4
1201 GCCCATGATCGTGCTAGCCTGTCGITGAGGACCCGGCTACGCTGGCGGCGTTGCCTTACT
1281 ATCAATCACCGATACGCGACCGAACGTGAACCGACTGCTGCTGCAAAACCTCTGCGACCT
– Перед вами тот же участок цепочки. Вы видите местоположение рестрикционных ферментов. На строчке 1201 вы видите, как два фермента перерезали поврежденный участок с обеих сторон. Обычно компьютеры у нас сами решают, какими средствами они воспользуются. С другой стороны, нам нужно знать, какие пары оснований необходимо вставить, чтобы исправить повреждение. Для этого мы сопоставляем разные участки, разрезанные ферментами. Как, например, здесь.
Сопоставление последовательности рестрикционных ферментов Код:
С= сравнение Р= развернутое сравнение П= подтверждение сравнения 0=
Окончание
Последовательность N 1 1820 бит/сек
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
=============================== 1
================== 2 ====================== 3
=================== 4
=========== 5
==================================== 6
Последовательность N 2 1202 бит/сек
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
============================================= 7
============ 8
========================== 9
– Теперь мы ищем такой участок цепочки, который перекрывает поврежденное место. Так мы узнаем, чего там не хватает. Вы увидите, что, таким образом, мы сможем исправить поврежденный участок. Темные полосы на экране – это ограниченные участки – маленькие отрезки ДНК динозавра. Мы разрезали их с помощью ферментов и проанализировали. Теперь компьютер соединяет их снова путем поиска накладывающихся участков кода ДНК. Это напоминает решение головоломки. Компьютер делает это очень быстро.
1 GCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAQCATCACAAAAATCGACGC
61 GGTGGCGAAACCCGACRGGACTATAAAGATCCCAGGCQTTTCCCCCTGGAAQCTCCCTGC
121 TQTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGC
181 TGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTG
241 CCGTTCAGCCCGACCGCTGCGCCTTATCCQGTAACTATCGTCTTGAGTCCAACCCGGTAA
301 AGTAGGACAGGTGCCGGCAGCGCTCTGGGTCATTTTCGGCGAGGACCGCTTTCGCTGGAG
361 ATCGGCCTGTCGCTTGCGGTATTCGGAATCTTGCACGCCCTCGCTCAAGCCTTCGTCACT
421 CCAAACGTTTCGGCGAGAAGCAGGCCATTATCGCCGGCATGGCGGCCGACGCGCTGGGCT
481 GGCGTTCGCGACGCGAGGCTGGATGGCCTTCCCCATTATGATTCTTCTCGCTTCCGGCGG
541 CCCGCGTTGAGGCCATGCTGTCCAGGCAGGTAGATGACGACCATCAGGGACAGCCTTCAA
601 CGGCTCTTACCAGCCTAACTTCGATCACTGGACCGCTGATCGTCACGGCGATTTATGCCG
661 CACATGGACGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAA
721 CAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAA
781 GCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGG
841 CTTTCTCAATGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTG
901 ACGAACCCCCCGTTCAGCCCACCGCTGCGCCTTATCCGGTCAACTATCGTCTTGAGTCCA
961 ACACGACTTAACCGGGTTGGCATGGATTGTAGGCGCCGCCCTATACCTTGTCTGCCTCCC
1021 GCGGTGCATGGAGCCGGGCCACCTCGACCTGAATGGAAGCGCGCGGCACCTCGCTAACGG
1081 CCAAGAATTGGAGCCAATCAATTCTTGCGGAGAACTGTGAATGCGCAAACCAACCCTTGG
1141 CCATCGCGTCCGCCATCTCCAGCAGCCGCACGCGGCGCATCTCGGGCAGCGTTGGGTCCT
1201 GCGCATGATCGTGCTCCTGTCGTTAGCCTGGAGGACCCGGCTAGGCTGGCGGGGTTGCCT
1281 ATGAATCACCGATACGCGAGCGAACGTGAAGCGACTGCTGTGCAAAACGTTGCGACCTAA
1341 ATGAATGGTCTTCGGTTTCCGTGTTTCGTAAAGTCTGGAAACGCGGAAGTCAGCGCCCTG
– И вот перед вами воссозданная компьютером цепочка ДНК. На работу, которую мы с вами провели, в обычной лаборатории ушли бы месяцы, а у нас – секунды.
– Значит, вы работаете с полной цепочкой ДНК? – поинтересовался Грант.
– Да нет, – сказал Ву. – Это невозможно. Мы добились большого прогресса по сравнению с шестидесятыми. Тогда на дешифровку такого кода у целой лаборатории ушло бы четыре года. Теперь компьютеры делают это в течение нескольких часов. Однако даже сейчас мы не можем развернуть всю цепочку. Мы исследуем только те ее участки, которые отличают динозавра от других доисторических животных или не встречаются в современных молекулах ДНК. Межвидовое расхождение по нуклеотидам не превышает нескольких процентов, но все равно, чтобы их проанализировать нужно провести очень большую работу.
***
Деннис Недри зевнул. Он давно уже понял, чем примерно должны заниматься в «Ин-Джин». Несколько лет назад, когда Недри наняли в «Ин-Джин» для того, чтобы он разработал системы управления Парком, он удивился, увидев, что согласно техническому заданию длина групп разрядов числовых данных должна достигать не менее З Х 10^9. Сначала Недри подумал, что тут какая-то ошибка, и позвонил в Пало-Альто. Однако там ему сказали, что требование правильное, действительно, три миллиарда разрядов чисел.
С большими системами Недри приходилось работать много и в прошлом. Профессиональный авторитет он заработал, создавая межконтинентальные линии телефонной связи для транснациональных корпораций. Такие системы обычно требуют несколько миллионов записей. К подобной работе он привык. Но в «Ин-Джин» хотели создать что-то немыслимо гигантское. Не понимая в чем дело, Недри поехал к Барни Феллоузу, который работал в компании «Симболикс» в Кембридже.
– Послушай, Барни, – спросил он своего приятеля, – что это за база данных, которая требует трех миллиардов записей?
– Напортачили, когда техзадание писали. – засмеялся Барни, – лишний ноль вписали. А может, два.
– Там все правильно, я проверял. Они хотят три миллиарда.
– Свихнулись, наверное, – предположил Барни. – Она работать не будет. Даже если у них самые быстрые процессоры и алгоритмы, то поиск данных займет несколько дней. Или недель.
– Это я знаю, – отмахнулся Недри. – Слава богу, мне хоть алгоритмы не надо делать. Но меня только попросили разработать архивирование и память для программы. И все-таки, для чего может служить такая база данных?
– Бумагу о неразглашении подписывал? – спросил, нахмурившись, Барни.
– Да, – ответил Недри, большинство контрактов которого включали пункт о неразглашении конфиденциальной информации.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120