9. Принцип дублирования частот Методика обнаружения дубликатов

9. Принцип дублирования частот

Методика обнаружения дубликатов

Настоящая методика является в некотором смысле частным случаем предыдущей методики, но ввиду важности для датировки прием обнаружения дубликатов выделен здесь в отдельный пункт. Пусть интервал времени (А,В) описан в летописи X, разбитой на «главы-поколения» Х(Т). Пусть они в целом занумерованы хронологически верно, но среди них есть два дубликата, т. е. две «главы», говорящие об одном и том же поколении, дублирующие, повторяющие друг друга. Рассмотрим простейшую ситуацию, когда одна и та же «глава» встречается в летописи Кровно два раза, а именно, с номером Q и с номером R. Пусть Q меньше R. Наша методика позволяет обнаружить и отождествить эти дубликаты. Ясно, что частотные графики К(Q,Т) и К(R,Т) имеют вид, показанный на рис. 3.6.

Рис. 3.6. Вид частотных графиков в случае, когда есть пара дубликатов

Первый график явно не удовлетворяет принципу затухания частот, поэтому нужно переставить «главы» внутри летописи X, чтобы добиться лучшего соответствия с теоретическим графиком. Все числа К(R,Т) равны нулю, так как в «главе» Х(R) нет ни одного «нового имени» — все они уже появились в Х(Q). Ясно, что наилучшее совпадение с графиком на рис. 3.4 получится, если эти два дубликата поместить рядом или просто их отождествить.

Итак, если среди «глав» летописи, в целом занумерованных правильно, обнаружились две «главы», графики которых имеют приблизительно вид графиков на рис. 3.6, эти «главы», скорее всего, являются дубликатами, то есть говорят об одних и тех же событиях, и их следует отождествить. Все сказанное переносится на случай, когда есть несколько дубликатов — три и т. д.

Эта методика была проверена на экспериментальном материале. В качестве простого примера было взято издание «Истории Флоренции» Макьявелли 1973 года (Ленинград), снабженное развернутыми комментариями. Ясно, что комментарии можно рассматривать как серию «глав», дублирующих основной текст Макьявелли. Основной текст был разбит на «главы-поколения», что позволило построить квадратную частотную матрицу К{Т}, охватывающую и комментарий к «Истории». Эта матрица имеет скопление максимумов вдоль отрезка, параллельного главной диагонали. Это означает, что наша методика успешно обнаруживает известные дубликаты. В данном случае — комментарии к основному тексту «Истории» Маккьявелли.