ТВОРЧЕСТВО

ПОЗНАНИЕ

А  Б  В  Г  Д  Е  Ж  З  И  Й  К  Л  М  Н  О  П  Р  С  Т  У  Ф  Х  Ц  Ч  Ш  Щ  Э  Ю  Я  AZ

 


Предположим, что промежуток времени I_Y был описан МНОГИМИ
летописцами -- очевидцами или современниками происходящих
событий.
Каждый из них составлял свою короткую летопись Z_i по
современным ему событиям. Поскольку мы изучаем сейчас не весь
текст летописи, а только имена, извлеченные из нее, то можем
считать (для удобства), что каждый летописец составлял некий
короткий хронологический список имен, который мы также обозначим
через Z_i.
Если промежуток времени I_Y описывался K летописцами, то в
основе наших знаний о события, происходивших на этом промежутке,
лежит K коротких летописей Z_1, Z_2,..., Z_K (включая и утраченные
летописи). Множество этих летописей (коротких хронологических
списков имен) мы обозначим через {Z_i}.
Множество {Z_i} образует некоторое покрытие списка Y.
Это покрытие мы будем считать:
а) Достаточно плотным, то есть предположим, что каждый
отдельный год из промежутка I_Y описывался не одним, а сразу
несколькими летописцами независимо друг от друга.
б) Состоящим из уже искаженных -- как-то разреженных и
местами ошибочных коротких хронологических списков. В самом
деле, даже в своем исходном виде каждая из летописей
Z_1, Z_2,..., Z_K упоминала, возможно, не все имена правителей, не
всех исторических деятелей, участвующих в событиях. Кроме того,
при последующем переписывании и компиляциях появлялись ошибки,
пропуски, произвольные вставки и т. п. Для простоты рассуждений
мы будем считать все эти ошибки присущими летописям Z_i с самого
начала.
Итогом работы по составлению хронологии в ее современном
виде явилась некоторая новая склейка списков Z_i (новое
совмещение их на оси времени), которая и породила известный нам
хронологический список имен Х.
Рассмотрим два отрезка \ВД\А_1, \ВД\А_2 списка имен Х и попытаемся
ответить на вопрос: нет ли такой пары Z_i, Z_j коротких
хронологических списков из множества {Z_i}, которые в списке Y
(в реальности) относились к одному и тому же месту, а в списке
Х оказались "подклеенными" к \ВД\А_1 и \ВД\А_2 соответственно? Так же как и
в модельном примере с картами (см. главу 1), заключаем, что если
такая пара есть, то увеличивается вероятность того, что имена из
\ВД\А_1 и \ВД\А_2 окажутся близко друг от друга где-то в списке Х (за счет
третьей, "склеивающей" летописи Z_m, смешивающей имена из Z_i и
Z_j).

p3'3'2
2. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ СВЯЗЕЙ МЕЖДУ ДУБЛИКАТАМИ
В ЛЕТОПИСИ
Пусть дан хронологический список имен Х. Начиная с этого
места забудем на время о разбиении списка Х на главы. В отличие
от задачи определения ВЕЛИЧИН СДВИГОВ между дубликатами, для
построения МАТРИЦЫ СВЯЗЕЙ временна'я шкала в списке не
используется. После построения матрицы мы снова воспользуемся ею
для СОДЕРЖАТЕЛЬНОЙ интерпретации результатов.
Для уточнения понятий "отрезок списка" и "близость в списке"
введем следующие определения.
ОПРЕДЕЛЕНИЕ. Для i-го имени a_i в списке имен Х =
{a_1,..., a_n} его ОПРЕДЕЛЯЮЩЕЙ ОКРЕСТНОСТЬЮ РАДИУСА k назовем
отрезок списка:
\ВД\А_{a_i}(k) = \ВД\А_i(k) = \ВД\А_i = {a_{i-k},..., a_{i+k}}, (k Определяющая окрестность радиуса k не вводится для k первых
и k последних имен списка. Число 2k+1, равное числу имен в
определяющей окрестности, будем называть ДЛИНОЙ этой окрестности.
ОПРЕДЕЛЕНИЕ. НЕНОРМИРОВАННОЙ СВЯЗЬЮ двух имен из множества I
различных имен списка Х назовем число пар таких же имен,
расположенных друг от друга в списке Х на расстоянии меньшем, чем
p (то есть разность их номеров в списке меньше, чем p). Число p
явяется параметром модели и называется ДЛИНОЙ СВЯЗЫВАЮЩЕЙ
ОКРЕСТНОСТИ. Ненормированную связь имен u_i и u_j обозначим через
l_0(u_i, u_j).
Параметры k и p подбирались в каждом случае отдельно с целью
получить наиболее четкий результат. Оказалось однако, что
изменение этих параметров для реальных хронологических списков
имен слабо влияет на результат.
В частности, общая структура матрицы связей оставалась
неизменной при всех рассмотренных значениях k и p (1\Д<\Аk\Д<\А7,
3\Д<\Аp\Д<\А17).
НЕНОРМИРОВАННАЯ СВЯЗЬ l_0(u_i, u_j) неудобна тем, что она не
учитывает резких различий В КРАТНОСТЯХ вхождения имен в список Х,
характерных для реальных хронологических списков. В то же время,
часто употреблямые имена естественным образом должны в среднем
чаще "случайно" есближаться в списке Х, чем имена более редкие.
Чтобы исключить влияние кратности имен на их связь, введем
следующее определение.
ОПРЕДЕЛЕНИЕ. Пусть два имени u_i и u_j входят в список Х с
кратностями k_i и k_j соответственно. Назовем НОРМИРОВАННОЙ
СВЯЗЬЮ этих имен (или просто -- СВЯЗЬЮ) число
З
| l_0(u_i, u_j)
|
---------- при iЬj,
|
k_ik_j
l(u_i, u_j) = { (*)
|
| 2l_0(u_i, u_j)
|
| ---------- при i=j, k_i>1.
Ю k_i(k_i- 1)
Для уникального имени в списке (то есть при i=j, k_i=1) понятие
связи такого имени с самим собой не вводится.
Поясним выбор нормировки в этом определении. Эта
нормировка выбиралась так, чтобы связь любой пары имен из
списка Х являлась бы случайной величиной со средним, не
зависящим от выбора этой пары.
При этом предполагалось, что вероятностный механизм
возникновения правильного хронологического списка Х таков, что
при условии, что нам известно все множество имен списка, но
неизвестен их порядок, все перестановки имен (все варианты выбора
их порядка) равновероятны. Другими словами, мы вводим следующее
предположение.
ПРЕДПОЛОЖЕНИЕ.
ЗНАНИЕ ЛИШЬ НЕУПОРЯДОЧЕННОГО МНОЖЕСТВА ИМЕН ПРАВИЛЬНОГО
ХРОНОЛОГИЧЕСКОГО СПИСКА Х НЕ МОЖЕТ НЕСТИ В СЕБЕ НИКАКОЙ
ИНФОРМАЦИИ О ПОРЯДКЕ СЛЕДОВАНИЯ ЭТИХ ИМЕН В СПИСКЕ Х.
В этом предположении справедлива следующая лемма.
ЛЕММА 1. Пусть дан правильный хронологический список Х.
Предположим, что максимальная кратность имени в этом списке, а
также параметр p (длина связывающей окрестности) много меньше
длины списка Х. Тогда среднее значение ненормированной связи двух
имен u_i и u_j, входящих в список Х с кратностями k_i и k_j
соответственно, пропорционально числу
З
| k_ik_j при iЬj,
c(u_i, u_j) = c(k_i, k_j) = {
|
k_i(k_i-1)/2 при i=j.
Ю
ДОКАЗАТЕЛЬСТВО.
а) Рассмотрим случай iЬj. Схему равновероятных размещений
имен в списке Х можно представить как итог последовательного
размещения n имен по n местам в списке. При этом, каждое имя
равновероятно занимает одно из оставшихся свободными мест.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153