1. Введение

1. Введение

В современной математической статистике большое применение нашел важный метод разладки, созданный А.Н. Ширяевым. В настоящей работе кратко описываются результаты интересного численного эксперимента, идея которого впервые предложена А.Н. Ширяевым и А.Т. Фоменко. Эта идея и эксперимент обсуждались на научно-исследовательском семинаре «Геометрия и статистика», несколько лет работавшем под руководством А.Т. Фоменко и А.Н. Ширяева в математическом ин-те им. В.А. Стеклова АН СССР. Цель эксперимента — применить метод разладки к важной задаче выявления, распознавания «однородных кусков» внутри достаточно больших исторических текстов. К таким текстам относятся, в частности, исторические хроники, летописи и т. п. Теоретические основы метода разладки см. в статье Б.Е. Бродского и B.C. Дарховского, помещенного в настоящей книге как Дополнение 1.

Выявление информативных количественных характеристик текстов и предварительная обработка исторических текстов, в частности, русских летописей и исторических книг Библии, были выполнены Г.В. Носовским и А.Т. Фоменко. Статистический анализ и компьютерный эксперимент затем проведены Б.С. Дарховским и Б.Е. Бродским. Большую помощь при этом нам оказали Т. Толозова, А. Громова и Л. Мищенко.

Напомним постановку задачи. Многие исторические источники составлены из фрагментов разной природы. Эти отдельные куски могли быть написаны в разное время разными авторами и вообще в разных странах. Затем отдельные фрагменты были объединены каким-то более поздним летописцем в одну книгу. Они начинали существовать, «спаянные» в единое целое внутри какой-то одной поздней летописи. При многократной ее переписке, при редакторских изменениях, внешние различия, существовавшие первоначально между старыми фрагментами, составляющими «новый большой текст», постепенно стирались. Сегодня такие составные тексты часто воспринимаются как единое целое, поскольку предыстория их возникновения давно забыта.

Возникает вопрос: можно ли, опираясь на численный, статистический анализ различных частотных характеристик, выявить сегодня внутри единой большой летописи эти первичные составные ее части, куски.

В основу излагаемого метода положена идея, согласно которой каждый первичный, древний фрагмент был более или менее «однородным». Например, он мог быть написан одним автором, а потому несет на себе характерный отпечаток одной индивидуальности. Единый стиль, манера и т. п. Поскольку эта гипотетическая индивидуальность, по-видимому, «мало менялась» в процессе написания одного текста, то можно сформулировать естественную гипотезу, модель о «первичной однородности» фрагментов, написанных одним автором, в одно время, или в одной и той же исторической школе летописцев.

Эта на первый взгляд простая идея, сформулированная А.Н. Ширяевым и А.Т. Фоменко, оказалась полезной при анализе конкретных исторических текстов. Более того, оказалось, что результаты, полученные на основе применения этой идеи и статистического исследования B.C. Дарховского, Б.Е. Бродского и Г.В. Носовского, применительно к конкретным историческим текстам, хорошо согласуются с независимыми результатами, полученными применением совсем других методов, тоже статистического характера.

В качестве численной характеристики исследуемого текста была взята функция объема, введенная А.Т. Фоменко в книге «Числа против Лжи», гл. 5. Напомним ее определение. Предположим, что исторический текст X разбит на «главы» X(t), где каждая «глава» — это фрагмент текста, описывающий события одного года t. Такова структура многих древних летописей. Она условно изображена на рис. d2.1. Например, слева на странице хроники указываются годы, скажем, по эре от сотворения мира, или по эре Р.Х. Рядом с каждым годом помещен фрагмент текста, излагающий события, происшедшие (по мнению летописца) именно в этом году. Это и есть фрагменты X(t). Далее, можно вычислить объем каждого фрагмента. Объем можно измерять, например, числом строк, или числом страниц, или числом знаков. Таким образом, получается последовательность чисел — объемов глав X(t). Их удобно изобразить в виде графика, рис. d2.2. Выбор единицы измерения объема здесь для нас абсолютно несущественен, так как изменение единицы измерения приводит лишь к смене масштаба по вертикали на рис. d2.2.

Рис. d2.1. Условная структура погодной летописи. Летописец разбил текст на главы, описывающие события какого-то одного года. Некоторые годы, о которых он ничего не знал, могут быть пропущены

Рис. d2.2. График объемов погодной летописи

Излагаемый ниже метод разбиения больших исторических текстов на однородные и неоднородные куски применим не только к графикам объема текстов, но и к другим численным характеристикам. Но для простоты мы будем говорить здесь лишь о функциях объемов.

Выше мы говорили об однородных кусках исторических текстов. Однако в действительности, мы разобьем тексты на так называемые стационарные куски, являющиеся не только однородными, но и такими, что внутри них «параметры процесса» практически не меняются.

Данный текст является ознакомительным фрагментом.