Г.В.Носовский, А.Т.Фоменко. Империя (Части 4-7)

СЛЕДОВАТЕЛЬНО, ТО ОБСТОЯТЕЛЬСТВО, ЧТО МЫ ВСЕ ЖЕ ОБНАРУЖИВАЕМ
ТАКУЮ СТРУКТУРУ В БОЛЬШОМ КОЛИЧЕСТВЕ РЕАЛЬНЫХ ХРОНОЛОГИЧЕСКИХ
СПИСКОВ, ОТНЮДЬ НЕ ТРИВИАЛЬНО. СЛУЧАЙНО ОНО ВОЗНИКНУТЬ НЕ МОГЛО.
Мы воспользуемся примером списка имен АРМЯНСКИХ КАТОЛИКОСОВ
для того, чтобы показать, как меняется гисторамма частот
разнесений связанных имен при постепенном РАЗРУШЕНИИ системы
дубликатов в списке (остальные хронологические списки имен ведут
себя аналогично).
Обратимся снова к рис. 27. На нем помимо сплошной кривой
изображена более сглаженная -- пунктирная. Это гистограмма f (x)
2
для (искаженного) списка имен армянских католикосов, в часть глав
которого (30 из 175) было добавлено одно и то же имя.
Видно, что эта гисторамма СУЩЕСТВЕННО БЛИЖЕ К ПРЯМОЙ ЛИНИИ,
чем исходная, хотя она и повторяет в точности ее структуру (места
всплесков не изменились, но сами всплески стали более пологими).
Наконец, случайная перестановка 20% имен из списка АК
ПОЛНОСТЬЮ РАЗРУШИЛА структуру дубликатов в нем (с "точки зрения"
нашей методики): вычисленная после этого гистограмма f (x) в
2
точности совпала с линейной функцией (пунктирная прямая на рис. 27
изображает одновременно эту гисторамму и гистограмму f (x) ).
1
p3'2'3
3. МЕРА РАЗЛИЧИЯ МЕЖДУ ГИСТОГРАММАМИ ЧАСТОТ
РАЗНЕСЕНИЯ ИМЕН
Здесь мы введем меру различия между распределениями P{\Вз\А=x}
и P{\Вз\А=x|A}, где A -- некоторое локальное событие. Эта мера имеет
смысл вероятности того, что реализованное в эксперименте
различие между этими двумя распределениями возникнет при
гипотезе о правильности данного хронологического списка Х.
Предположим, что рассматриваемый хронологический список Х
является результатом некоторого случайного эксперимента.
При этом, мы будем считать, что общее количество имен в списке
Х и их кратности вхождения в список заранее фиксированы
(неслучайны), а порядок имен в списке Х является случайным
элементом, который мы обозначим через \Вw\А_1.
Соответствующее вероятностное пространство обозначим через
(\ВW\А_1, \ВS\А_1, P_1), где \ВW\А_1 -- множество всех перестановок имен в списке Х;
\ВS\А_1 = 2^\ВW\А 1, P_1 -- некоторая вероятностная мера на \ВS\А_1, относительно
которой мы пока не будем делать никаких предположений.
Таким образом, порядок имен в хронологическом списке Х мы
рассматриваем как элементарный исход в вероятностной схеме
(\ВW\А_1, \ВS\А_1, P_1).
Рассмотрим разбиение списка Х на N глав одинакового объема
(Мы предполагаем, что длина списка n делится на N.) Число глав
N считаем фиксированным и не зависящим от случая. Как и выше,
построим по списку Х, разбитому на N глав, вероятностную схему
повторного выбора с возвращением двух элементов списка Х и
определим случайную величину \Вз\А -- разнесение выбранных элементов
списка (абсолютную величину разности номеров глав, их
содержащих).
Соответствующее этой схеме вероятностное пространство
(\ВW\А_2, \ВS\А_2, P_2) состоит из множества элементарных исходов \ВW\А_2, которое
представляет собой множество пар порядковых номеров выбранных
элементов в списке : \Вw\А_2= {i, j},
1\Д<\Аi, j\Д<\Аn, алгебры событий \ВS\А_2 = 2^\ВW\А 2 и равномерного распределения:
P_2(\Вw\А_2) = 1/n^2 для любого \Вw\А_2\ВEW\А_2.
Поскольку мера P_2 не зависит от \Вw\А_1, то итоговое
вероятностное пространство (\ВW\А, \ВS\А, P) является произведением
пространств (\ВW\А_1, \ВS\А_1, P_1) и (\ВW\А_2, \ВS\А_2, P_2):
\ВW\А = \ВW\А_1\Иx\ВW\А_2; \ВS\А=2^\ВW\А; P(\Вw\А)=P(\Вw\А_1, \Вw\А_2)=P_1(\Вw\А_1)\Иx\АP_2(\Вw\А_2).
На вероятностном пространстве (\ВW\А, \ВS\А, P) определена случайная
величина \Вз\А:
\Вз\А((\Вw\А)=\Вз\А(\Вw\А_1, \Вw\А_2)=\Вз\А(\Вw\А_2).
Пусть A -- некоторое событие из \ВS\А. Сформулируем
предположение о вероятностной мере P_1 (то есть о вероятностном
механизме образования порядка имен в правильном хронологическом
списке).
ПРЕДПОЛОЖЕНИЕ. Предположим, что случайная величина \Вз\А не
зависит от события A:
P{\Вз\А=x|A} = P{\Вз\А=x} для всех x.
Никаких других условий на меру P_1 мы накладывать не будем.
Сделанное предположение зависит от выбора события A. Если в
качестве A выбрать локальное событие (определение локальных
событий дано выше), то это предположение вытекает (для
правильного хронологического списка) из сформулированного выше
следствия гипотезы Н_0: P{\Вз\А=x|A, \Вз\Д>\Ве\А} = P{\Вз\А=x|\Вз\Д>\Ве\А}, где \Ве\А -
радиус затухания зависимости в списке Х.
Здесь мы без ограничения общности будем считать, что \Ве\А=0.
Общий случай сводится к этому простой модификацией вероятностой
схемы (\ВW\А_2, \ВS\А_2, P_2).

p3'3'1
Глава 3. МАТРИЦЫ СВЯЗЕЙ ДЛЯ ХРОНОЛОГИЧЕСКИХ СПИСКОВ ИМЕН
1. КАК УЗНАТЬ -- КАКИЕ ИМЕННО ЧАСТИ ЛЕТОПИСИ
ЯВЛЯЮТСЯ ДУБЛИКАТАМИ?
В предудущей главе с помощью гистограмм частот разнесений
связанных имен проверялась гипотеза об отсутствии дубликатов в
данном хронологическом списке имен.
В тех случаях, когда присутствие дубликатов было обнаружено,
определялись типичные сдвиги между дубликатами в списке. Однако
метод гистограмм частот связанных имен не дает прямого ответа на
следующий основной вопрос:
КАКИЕ ИМЕННО ЧАСТИ СПИСКА ЯВЛЯЮТСЯ ДУБЛИКАТАМИ И В КАКОЙ
МЕРЕ?
Напомним, что в соответствии с понятием слоистой хроники,
два отрезка хронологического списка называются ДУБЛИКАТАМИ, если
они содержат соответственно ДУБЛИРУЮЩИЕ ДРУГ ДРУГА СЛОИ.
В данной главе мы опишем метод, позволяющий отвечать на этот
вопрос. Результатом его применения к историческому
хронологическому списку будет являться так называемая "МАТРИЦА
СВЯЗЕЙ" (фрагментов) данного списка. Это -- КВАДРАТНАЯ ТАБЛИЦА,
показывающая в какой мере те или иные отрезка списка имен
являются дубликатами друг друга ("связаны" между собой).
Мы уже вкратце описали идею метода, пользуясь модельной
задачей о колоде карт (см. главу 1). Проведем теперь эти
рассуждения уже не для модельной задачи, а для РЕАЛЬНЫХ
хронологических списков.
Пусть имеется список имен Х, который может содержать ошибки,
пропуски и (или) дубликаты.
НЕИЗВЕСТНЫЙ НАМ ИСТИННЫЙ СПИСОК ИМЕН, лежащий в основе
реального списка Х, обозначим через Y. Таким образом, Y -
ВООбРАЖАЕМЫЙ список имен, содержащий полные неискаженные данные
(скажем, об именах правителей данного государства) для
длительного исторического промежутка времени I_Y.
РЕАЛЬНЫЙ список имен Х, который находится в нашем
распоряжении является ИСКАЖЕНИЕМ, "зашумлением" списка Y с
возможной потерей доли информации.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153

ПОИСК КНИГ
ТОП лучших авторов книг Либока

ТВОРЧЕСТВО

ПОЗНАНИЕ