2. 5. Математическое описание списков имен с правильной хронологией

We use cookies. Read the Privacy and Cookie Policy

2. 5. Математическое описание списков имен с правильной хронологией

Исследуем структуру хронологического списка Х, сравнивая распределение з с распределениями з2 и з3. Естественные представления о том, как должен быть устроен правильный хронологический список имен приводят к следующему интуитивно очевидному утверждению:

(А) В случае правильной хронологии списка Х, условие и В = А и (или и : и), наложенное на пару имен списка, не должно влиять на глобальные особенности взаимного расположения всего множества таких же имен в списке Х.

Ясно, что утверждение (А) тесно связано с принципом затухания частот. В самом деле, оно означает, что локальные связи имен в списке не должны приводить к их глобальным связям.

Так будет, если в списке нет глобальных зависимостей, а локальные зависимости затухают. Но именно этого требует от правильных списков принцип затухания частот.

Утверждение (А) можно формализовать с помощью введенных выше случайных величин з2, з3 и з следующим образом.

(Б) Распределения случайных величин з2 и з3, построенные по списку с правильной хронологией, в котором отсутствует зависимость между различными главами, должны совпадать с распределением з. Графики функций f2 и f3, построенные по такому списку, разбитому на главы одинакового объема, должны совпадать

на промежутке от 1 до N с графиком линейно убывающей функции. Если же между близкими главами списка есть взаимная зависимость, постепенно затухающая для все более отдаленных пар глав, то графики функций f2 и f3 должны совпадать с графиком линейно убывающей функции лишь на промежутке от е до N, где е – радиус затухания зависимости в списке.

Замечание. Строго говоря, это утверждение верно для бесконечных списков, так как некоторые расхождения между распределениями з2 и з3, з могут возникать из-за конечности длины списка Х. Поэтому методика применима лишь к спискам достаточно большого объема (не менее 150-200 имен).

Ясно, что утверждение (Б) является следствием утверждения (А).

В самом деле, значения Вз, большие, чем е, определяются лишь теми парами имен, которые разнесены в списке не менее, чем на е глав. Составы карт в главах, удаленных друг от друга не менее, чем на е номеров, по предположению, независимы друг от друга. Утверждение (А) означает, что такая зависимость не может возникнуть и в том случае, если мы ограничимся рассмотрением лишь локально связанных пар имен (сопряженных, ровесников).

Таким образом, из (А) следует, что это ограничение не влияет (в правильных списках) на вероятность появления того или иного значения расстояний между именами в выбранной паре имен, при условии, однако, что это расстояние не меньше, чем е. Другими словами, соответствующие условные распределения з совпадают с безусловными – что и утверждается в (Б).

Вывод

Итак, для правильных списков имен Х распределения случайных величин з2 и з3 должны совпадать на отрезке [е, N] с линейно убывающей функцией, равной нулю в точке x=N.

Предположим теперь, что список Х содержит дубликаты, сдвинутые друг относительно друга на расстояния Д,…, ДD глав (см. рис. 17). Покажем, что в этом случае распределение случайной величины з естественным образом зависит от событий типа А или В, введенных выше.

В самом деле, пусть ur, us – имена, сопряженные (встретившиеся) в некоторой главе Хi списка Х. Тогда с некоторой вероятностью (большей, чем в отсутствии этого условия) эти же имена будут встречаться и в главах-дубликатах главы Хi. Значит, разнесения пар имен, встретившихся в тех главах списка, которые имеют дубликаты в нем, с повышенной частотой будут принимать значения 0, Д1,…, ДD, равные расстояниям между дубликатами в списке Х.

Если в списке достаточно много дубликатов, то случайные величины з2 и з3 заметно изменят свое распределение по сравнению со случайной величиной з. Это произойдет из-за того, что их значения будут сгущаться около нуля (что соответствует повторной встрече имен, встретившихся в главе Хi, в дубликатах этой главы) и Д1,…, ДD (что соответствует ситуации, когда одно из имен, встретившихся в главе Хi, попало в один дубликат этой главы, а другое – в другой, отстоящий от первого на расстояние одного из сдвигов Д1,…, ДD). См. рис. 20.

Следовательно, в случае, когда список Х содержит дубликаты, разнесенные друг от друга на расстояния Д1,…, ДD, гистограммы частот связанных имен f2(x) и f3(x) будут содержать всплески на значениях сдвигов Д1,…, ДD. Это обстоятельство иллюстрируется на рис. 21.

На этом рисунке условно изображен список Х, являющийся суммой (с наложением) трех взаимно дублирующих друг друга списков: Х = Y+Y+Y. Дубликаты Y=Y=Y сдвинуты друг относительно друга в Х на величины s1, s2, s3 соответственно. В верхней части рисунка изображено, какая при этом получится гистограмма частот разнесений связанных имен – она будет содержать всплески на значениях сдвигов s1, s2, s3.

Данный текст является ознакомительным фрагментом.