7.2. Принцип корреляции максимумов
7.2. Принцип корреляции максимумов
Пусть исторический период от года A до года B в истории региона P описан в летописи X, разбитой на куски (главы) X(T), каждый из которых посвящён событиям одного года T. Подсчитаем объём всех кусков X(T), т. е. число страниц или строк в каждом X(T).
Полученные числа изобразим в виде графика объёмов, отложив по горизонтали годы T, а по вертикали – объёмы глав. Полученную функцию естественно назвать функцией объёма vol X(T) данной летописи X (рис. 1.2). Для другой летописи Y, описывающей те же события, график объёмов будет иметь, вообще говоря, иной вид. Здесь скажутся интересы и склонности летописцев X и Y – одно и то же событие может быть описано разным количеством слов.
Насколько существенны эти различия? Есть ли что-то общее в графиках объёмов текстов, рассказывающих об одних и тех же событиях?
Оказывается, есть. Но прежде скажем несколько слов о механизме утери информации.
Существенная характеристика всякого графика – его пики, экстремальные точки. В графике объёма они приходятся на годы, в которые кривая достигает локальных максимумов, т. е. на годы, наиболее подробно описанные в летописи на исследуемом отрезке времени. Обозначим через C(T) объём всех текстов, написанных о годе T его современниками. Это – «первоначальный фонд» информации (рис. 1.3). Его график нам точно неизвестен, поскольку тексты постепенно утрачиваются, гибнут.
Сформулируем модель потери информации.
От тех лет, которым первоначально было посвящено больше текстов, больше текстов и останется.
Другими словами, если мы фиксируем какой-то момент времени M (справа от точки B на рис. 1.3), то можем построить график C_M(T), показывающий объём текстов, которые «дожили» до момента времени M и описывают события года T.
Другими словами, C_M(T) – это остаточный, сохранившийся фонд информации от эпохи (A, B), который дошёл до года M.
Наша модель может быть переформулирована, следовательно, таким образом:
График C_M(T) должен иметь всплески примерно в те же годы на интервале (A, B), что и исходный график C(T).
Разумеется, проверить модель в таком её виде трудно, поскольку график C(T) первоначального фонда информации нам сегодня неизвестен. Но одно из следствий проверить можно.
Более поздние летописцы X и Y, описывая один и тот же период времени (A, B) и не будучи его современниками, вынуждены опираться на сохранившийся до их времени фонд информации, текстов от эпохи (A,B).
Если летописец X живёт в эпоху M, то он будет опираться на фонд C_M(T). Если летописец Y живёт в эпоху N, отличную, вообще говоря, от эпохи M, то он опирается на сохранившийся фонд C_N(T).
Естественно ожидать, что «в среднем» хронисты работают более или менее добросовестно, а потому они должны более подробно описать те годы из эпохи (A, B), от которых до них дошло больше информации, текстов.
Другими словами, график объёмов vol X(T) будет иметь всплески примерно в те годы, где имеет всплески график C_M(T). В свою очередь, график vol Y(T) будет иметь всплески примерно в те годы, где делает всплески график C_N(T).
Но точки всплесков графика C_M(T) близки к точкам всплесков исходного графика C(T). Аналогично, и точки всплесков графика C_N(T) близки к точкам всплесков графика C(T). Следовательно, графики vol X(T) и vol Y(T) должны делать всплески примерно одновременно, т. е. точки их локальных максимумов должны коррелировать (рис. 1.4).
При этом, конечно, амплитуды графиков могут быть существенно различны (рис. 1.5а). Итак, в окончательном виде наш принцип корреляции максимумов звучит следующим образом:
1. Если хроники X и Y зависимы, т. е. описывают примерно одни и те же события на одном и том же интервале времени (A, B) в истории одного и того же региона, то точки локальных максимумов их функций объёмов должны коррелировать (рис. 1.5а).
2. Если хроники X и Y независимы, т. е. описывают существенно разные исторические периоды или разные географические регионы, то точки локальных максимумов их функций объёмов не коррелируют (рис. 1.5б).
Другими словами, графики объёмов глав для зависимых летописей должны делать всплески одновременно, т. е. годы, подробно описанные в летописи X, и годы, подробно описанные в летописи Y, должны совпадать или быть близкими.
Напротив, если летописи независимы, то графики объёмов достигают локальных максимумов в разных точках (после совмещения двух описываемых в них периодов времени).
После математической формализации принципа корреляции максимумов был проведён статистический эксперимент, в котором модель проверялась на заведомо зависимых и заведомо независимых парах исторических текстов.
Принцип подтвердился. См. детали в [нх-1].
Это позволило предложить методику распознавания зависимых и независимых текстов, а также методику датирования событий, описанных в хрониках. Например, чтобы датировать события, описанные в какой-то летописи, надо попытаться подобрать такой достоверно датированный текст, чтобы графики объёмов достигали максимумов практически одновременно. Если это удаётся, мы датируем события, описанные в исследуемой летописи.
Если же датировки событий двух сравниваемых хроник неизвестны, но всплески их графиков объёмов практически совпадают, то мы можем с высокой вероятностью предположить их зависимость, т. е. близость или даже совпадение описываемых в них событий.