1.6. Описание статистической модели и формализация

We use cookies. Read the Privacy and Cookie Policy

1.6. Описание статистической модели и формализация

Рассмотрим интервал времени (А, В), введем на нем координату x, изменяющуюся от 0 до В-А, где В-А — это длина интересующего нас временного промежутка. Ясно, что x = t — А. Пусть f(x) — vol X(x) — функция объема летописи X. Через G(x) обозначим функцию G(x) = f(0)+ f(1) +… + f(x), то есть «интеграл» функции f от 0 до x. Назовем эту функцию НАКОПЛЕННОЙ СУММОЙ летописи X. Рассмотрим нормированную накопленную сумму F(x) = G(x)/vol X, где vol X — полный объем летописи X. Нормированная накопленная сумма изображается неубывающим графиком, значения которого нарастают от 0 до 1. Для разных летописей характер этого нарастания — разный.

Рассмотрим новую функцию g(x)=1—F(x). См. рис. 3.9. Ее график не возрастает. Опуская математические подробности, сформулируем следующую модель.

Рис. 3.9. Графики функций F(x) и g(x)=1—F(x)

ФУНКЦИЯ g(x) = 1 — F(x) ДОЛЖНА ВЕСТИ СЕБЯ В БЕДНОЙ, НАЧАЛЬНОЙ ЗОНЕ ЛЕТОПИСИ КАК ФУНКЦИЯ ехр(—?x?).

В математической статистике распределения такого вида называются распределениями Вейбулла-Гнеденко.

Следовательно, мы располагаем двумя степенями свободы — параметром X и параметром а, меняя которые, можем пытаться аппроксимировать функцию 1—F(x). Если это удастся сделать для конкретных летописей, мы подтвердим нашу теоретическую модель.

Проведенный нами статистический эксперимент с реальными летописями показал, что действительно, затухание графика 1—F(x) достаточно хорошо аппроксимируется функцией ехр(—?x?) при подходящем выборе значений ? и ?.

В результате мы можем теперь сопоставить каждой летописи, а точнее — начальной, бедной зоне этой летописи, два числа: ? и ?, отражающие характер поведения функции объема летописи. Назовем ?— параметром ОБЪЕМА летописи, а ? — параметром ФОРМЫ летописи.

Оказывается, для нас наиболее важен параметр ?. Именно он, как показали статистические эксперименты, наиболее хорошо чувствует характер распределения отдельных редких всплесков графика объема внутри бедной зоны летописи. Именно параметр ? будет в первую очередь указывать нам — зависимы или независимы летописи. Параметр ? отвечает, скорее, за объем летописи; он чувствует — насколько летопись богата или бедна.

Итак, нашу гипотезу, статистическую модель можно теперь переформулировать так.

а) Если летописи X и Y ЗАВИСИМЫ, то отвечающие им пары параметров (?х, ?х) и (?Y, ?Y) должны быть БЛИЗКИ, при условии, что они вычислены для бедных зон летописей.

б) Если же летописи X и Y НЕЗАВИСИМЫ, то отвечающие им пары параметров (?х, ?х) и (?Y, ?Y) должны быть «далеки друг от друга».

Удобно изображать пару чисел (?, ?) точкой на обычной плоскости с декартовыми координатами ? и ?. См. рис. 3.10.

Рис. 3.10. Изображение двух параметров — формы и объема исследуемой летописи в виде точки на плоскости

Данный текст является ознакомительным фрагментом.