5. Различение зависимых и независимых пар определяющих окрестностей в хронологических списках имен
5. Различение зависимых и независимых пар определяющих окрестностей в хронологических списках имен
Перейдем к описанию способа определения порогов в множестве значений связи L(_r, _s), разделяющих зависимые и независимые пары определяющих окрестностей _r, _s. Приводимые ниже рассуждения имеют качественный характер. Они оправдываются aposteriori, так как позволяют получить более четкую картину структуры списка.
Важно, что наиболее существенные черты этой картины оказываются (во всех рассмотренных нами реальных примерах) нечуствительными не только к выбору параметров модели k и p (а также к приведенным выше изменениям в определении самой связи, что уже отмечалось), но и к колебаниям указанных порогов.
Пусть дан хронологический список имен Х. Зафиксируем для него параметры модели (k, p) и построим набор гистограмм частот появления значений связи L_0(_r, _s) (L_1 или L_2), при условии, что значение O(_r, _s) постоянно (для каждой из гистограмм оно свое). В рассмотренных нами реальных списках все эти гистограммы имели вид приблизительно как на рис. 28.
В качестве значения порога, отделяющего связь L_0 (L_1, L_2) для независимых пар определяющих окрестностей (_R, _S) от связи для зависимых пар (_R, _S) возьмем наименьшее значение, при котором соответствующая гистограмма падает до нуля (это значение для каждой пары (_R, _S), вообще говоря, свое, т. к. оно зависит от величины O(_R, _S)).
Связь, превосходящую такой порог, будем называть существенной связью, а связь, не превосходящую его – несущественной связью.
Определение.
Матрицей связей M(k, p, L_i, Х), 0, хронологического списка имен Х называется построенная по этому списку квадратная верхнетреугольная матрица размера (n-k)(n-k), в ячейке (r, s) которой стоит значение M_r, s.
Данный текст является ознакомительным фрагментом.