Новые эмпирико-статистические методики датирования древних событий

Вид материалаДокументы

Содержание


1. Методика локальных максимумов.
1.2. Принцип корреляции максимумов.
Принцип корреляции максимумов
Величина этих всплесков может быть существенно различной.
1.3. Статистическая модель.
1.4. Экспериментальная проверка принципа корреляции максимумов.
1.5. Методика датирования исторических событий.
1.6. Функции объемов исторических текстов и принцип
Максимумов функций объема.
1.6.2. Бедные и богатые летописи. бедные и богатые зоны летописей.
1.6.3. Значащие и незначащие нули функции объема.
1.6.4. Принцип уважения к информации.
Уважение летописца к уцелевшей информации обратно пропорционально ее объему.
1.6.5. Принцип амплитудной корреляции графиков объема в
1.6.6. Описание статистической модели и формализация.
1.6.7. Гипотеза о возрастании параметра "формы" летописи
1.6.8. Список и характеристики исследованных нами русских летописей.
1.6.9. Итоговая таблица численного эксперимента.
1.6.10. Интересные следствия из численного эксперимента.
1.6.11. Сравнение заведомо зависимых русских летописей.
...
Полное содержание
Подобный материал:
  1   2   3   4   5

Глава 3. НОВЫЕ ЭМПИРИКО-СТАТИСТИЧЕСКИЕ МЕТОДИКИ ДАТИРОВАНИЯ

ДРЕВНИХ СОБЫТИЙ.

По нашему мнению, основной задачей является создание новых независимых статистических методик датирования древних событий. Только после этого можно приступать к анализу всей хронологии в целом на основе получающихся результатов. Одной методики, - даже

такой эффективной, как описанная астрономическая, - совершенно

недостаточно для глубокого анализа проблемы, поскольку задача

датировки исключительно сложна и требует перекрестных проверок дат

разными методами. Развитая в настоящее время методология современной

математической статистики позволяет предложить новый подход к задаче

датирования событий, описанных в древних летописях. В настоящей главе

кратко излагаются новые эмпирико-статистические методики, разработанные

автором, и некоторые их применения к анализу хронологии.

Эта программа была реализована в следующей форме.

1) Разработаны новые эмпирико-статистические методики датирования древних событий. Они основаны на нескольких статистических принципах (моделях), предложенных автором в [373]-[396]. Краткое изложение см. в статьях [374]-[377], а подробное - в книгах [416], [429]-[438]. Основные принципы и основанные на них модели были сформулированы автором в докладе на 3-й Международной Вильнюсской конференции по теории вероятностей и математической статистике в 1981 году [376]. Были предложены: принцип корреляции максимумов, принцип малых искажений (для династий правителей), принцип затухания частот, принцип дублирования частот, принцип "улучшения" географических карт. Развитие этих методов было затем изложено в докладах на 4-й Международной Вильнюсской конференции по теории вероятностей и математической статистике [396] в 1985 году, и на Первом всемирном Конгрессе Общества математической статистики и теории вероятностей имени Бернулли [398] в 1986 году. Затем новые эмпирико-статистические модели были также предложены и экспериментально проверены в серии совместных работ

В.В.Калашникова, Г.В.Носовского, С.Т.Рачева, В.В.Федорова, А.Т.Фоменко

[388], [397], [400], [404], [405], [407]-[413], [415], [420]-[424].

2) Эти принципы, модели и их эффективность были проверены на достаточно большом достоверном материале средневековой и новой истории XV-XX веков. Эта проверка подтвердила правильность результатов, получаемых при помощи методик.

3) Затем эти же методики были применены к хронологическому материалу древней истории, обычно датируемому ранее X-XIII веков н.э.

См. [374]-[377], [416], [438]. Здесь неожиданно были обнаружены странные "повторы", "периодичности" в скалигеровской версии древней и средневековой истории. Мы условно назвали их "фантомными дубликатами".

4) Все эти фантомные дубликаты были собраны и систематизированы в виде глобальной хронологической карты, кратко описанной в статьях [375], [377], [416]. Предлагаемые методики отнюдь не рассматриваются нами как как универсальные. Все они имеют вполне определенные границы применимости (см. ниже). Единственным критерием правильности полученных результатов может служить обнаруженное нами согласование между собой дат, вычисляемых применением разных методик. В том числе, и методики астрономического датирования, описанной выше.

5) На основе глобальной хронологической карты, изображающей "скалигеровский учебник по древней истории", нам удалось восстановить предположительный механизм возникновения скалигеровской версии древней и средневековой хронологии. Весьма кратко изложим суть некоторых из этих методик.

1. МЕТОДИКА ЛОКАЛЬНЫХ МАКСИМУМОВ.

1.1. ФУНКЦИЯ ОБЪЕМА ИСТОРИЧЕСКОГО ТЕКСТА.

Принцип корреляции максимумов и основанный на нем метод был предложен и разработан в [375], [376], [379], [381].

Пусть обнаружен какой-то исторический текст X, например ранее неизвестная летопись, описывающая какие-то неизвестные нам события на довольно значительном интервале времени, от какого-то года A до года B. Причем, годы эти могут быть записаны в неизвестном нам летосчислении. В дальнейшем будем обозначать этот интервал времени через (A,B). Типичная ситуация такова: даты событий, описываемых в летописи, отсчитываются от какого-то события местного значения. Например, от основания какого-то города, или от момента воцарения того или иного правителя и т.п. В таких случаях будем говорить, что датировка событий дается в летописи в ОТНОСИТЕЛЬНОЙ хронологии. Этот термин позволит нам отличать подобные датировки от абсолютных дат событий в терминах годов до н.э. или годов н.э. Возникает естественный вопрос - как восстановить абсолютные даты событий, описанных в древнем документе? Например, как вычислить юлианскую дату основания города, от которой отсчитываются даты интересующих нас событий?

Конечно, если некоторые из описанных событий уже известны нам по другим летописям, это позволяет "привязать" их к современной шкале отсчета времени. Но если такое отождествление не удается, то задача датировки усложняется. При этом может оказаться, что описываемые в летописи события нам уже фактически известны. Однако их описание пока по внешности неузнаваемо, поскольку летопись написана на другом языке, летописец употребляет совсем другие имена, прозвища, географические названия и т.п. Поэтому полезно располагать методикой эмпирико-статистического характера, которая иногда позволяет датировать события на основании формальных количественных характеристик исследуемого текста.

Предположим, что исторический текст X разбивается на куски (фрагменты) X(t), каждый из которых описывает сравнительно малый по длине промежуток времени, например год (или десятилетие) с номером t. Примеры таких текстов многочисленны. Таковы погодные летописи, - то есть описывающие события год за годом, "по годам", - дневники, многие исторические произведения, учебники и монографии по истории. Куски, фрагменты X(t) мы будем условно называть "главами". Они естественно выстраиваются в хронологическую последовательность, согласно внутренней относительной хронологии данной летописи. Во многих исторических текстах подобное "разбиение на главы", - каждая из которых описывает свой отдельный год, - присутствует в явном виде. Таковы, например, многие русские летописи [165], [166], в том числе знаменитая Радзивиловская летопись (Повесть временных лет) [486]. Такова, например, известная римская книга Liber Pontificalis, изд. Т.Моммзена "Gestorum Pontificum Romanorum" (1898).

Разнообразные характеристики объема информации, сообщаемой летописью X о годе с номером t, могут быть измерены, например, так.

1) vol X(t) = количество страниц в "главе" X(t). Это число назовем объемом "главы" X(t). Объем может равнять нулю, если год t вообще не описан в летописи X, то есть пропущен. Вместо количества страниц можно подсчитывать число строк, число знаков и т.п. Это не влияет на идею и на применение методики.

2) Количество упоминаний года t во всей летописи X.

3) Количество имен всех исторических персонажей, упомянутых в "главе" X(t).

4) Количество упоминаний какого-то конкретного имени (персонажа) в "главе" X(t).

5) Количество ссылок в "главе" X(t) на некоторый другой текст.

Запас подобных количественных характеристик достаточно велик и весьма важен. Каждая характеристика, как мы видим, приписывает каждому году t, описанному в летописи, определенное число. Разным годам будут отвечать, вообще говоря, разные числа. Поэтому объемы "глав" X(t) будут, вообще говоря, меняться с изменением номера (года) t. Последовательность объемов X(A),...,X(B) мы назовем функцией объема данного погодного текста X.

1.2. ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ.

Итак, пусть некоторый исторический период от года А до года B в истории одного государства Г описан в каком-то достаточно обширной погодной летописи Х. То есть, летопись X уже разбита (или может быть разбита) на куски - "главы" Х(t), каждый из которых описывает один свой год t. Подсчитаем объем каждого такого куска, например, число слов или число знаков, страниц и т.п. Затем изобразим полученные числа в виде графика, отложив по горизонтали годы t, а по вертикали - объемы "глав", то есть vol X(t). См. рис.3.1. В результате мы изобразили функцию объема летописи X в виде графика.

Для другой погодной летописи Y, то есть тоже описывающей "поток событий" этой же эпохи (А,В) по годам, ее соответствующий график функции объема будет иметь, вообще говоря, другой вид. См. рис.3.1. Дело в том, что большую роль в распределении объема играют личные интересы летописцев X и Y. Например, хроника по истории искусств и военная летопись существенно по-разному расставляют акценты и по-разному распределяют объем информации по годам. Или, например, летописец X "проигравшей стороны" описывает поражение своей армии в войне весьма скупо и сдержанно (в нескольких строчках), а летописец Y "победившей стороны" рассказывает об этом же сражении очень подробно, восторженно и многословно, на нескольких страницах.

Насколько существенны эти различия? То есть, существуют ли такие характеристики графиков объема, которые определяются только интервалом времени (А,В), историей государства Г и которые однозначно

характеризуют все, или почти все летописи, описывающие этот временно'й

интервал и данное государство?

Оказывается, важной характеристикой графика объема vol X(t) являются годы t, в которые график делает ВСПЛЕСК, то есть достигает своих ЛОКАЛЬНЫХ МАКСИМУМОВ. То обстоятельство, что в некоторой точке t график делает всплеск, означает, что этот год описан в летописи БОЛЕЕ ПОДРОБНО, например, бо'льшим количеством страниц, чем соседние годы. Следовательно, всплески графика, то есть локальные максимумы указывают нам годы, подробно описанные летописцем на отрезке времени (А,В). B разных летописях X и Y "подробно описанными" могут оказаться, вообще говоря, разные годы.

Чем объясняется такая неравномерность в описании разных годов? Одно из объяснений таково. Летописец более подробно описал данный "древний год", поскольку от этого "древнего года" до него дошло больше уцелевшей информации, например, бо'льший объем старых документов, чем от соседних лет.

Схема дальнейших наших рассуждений такова.

1) Мы сформулируем теоретическую модель, то есть статистическую гипотезу, позволяющую предсказывать - какие именно годы из интервала времени (A,B) будут подробно описаны поздним летописцем, уже не являющимся современником описываемых им древних событий.

2) Затем мы математически формализуем эту статистическую модель (гипотезу).

3) Проверим ее справедливость на достаточно большом достоверном историческом материале.

4) Обнаружив, что теоретическая модель подтверждается в эксперименте, мы предложим методику датирования древних событий.

Пусть С(t) - объем всех текстов, написанных о годе t современниками этого года. См.рис.3.2. Как и выше, построим числовой график объема на интервале времени (A,B). Конечно, точный вид этого графика С(t) сегодня нам НЕИЗВЕСТЕН, так как с течением времени первичные тексты, написанные современниками событий года t, постепенно утрачиваются. До наших дней дошла только какая-то их часть. График C(t) можно назвать ГРАФИКОМ ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ. Пусть из эпохи (A,B) современники наиболее подробно описали некоторые годы, то есть зафиксировали об этих годах особенно много информации. Причины такой "первичной неравномерности" мы здесь обсуждать не будем, так как они для нас сейчас не важны. На языке графика объема C(t) такие "подробно описанные современниками" годы будут выявляться тем, что именно в эти годы график делает всплески.

Каков механизм потери и забывания письменной информации, приводящий с течением времени к уменьшению высоты графика C(t) и его искажению? Сформулируем МОДЕЛЬ ПОТЕРИ ИНФОРМАЦИИ.

Хотя с течением времени высота графика C(t) уменьшается, тем не менее, ОТ ТЕХ ЛЕТ, В КОТОРЫЕ ИХ СОВРЕМЕННИКАМИ БЫЛО НАПИСАНО ОСОБЕННО МНОГО ТЕКСТОВ, - БОЛЬШЕ И ОСТАНЕТСЯ.

Для переформулировки этой модели полезно поступить следующим образом. Фиксируем какой-то момент времени M справа от точки B на рис.3.2 и построим график C_M (t), показывающий объем текстов, которые <<дожили>> до момента времени M и описывают события года t из исторической эпохи (A,B).

Другими словами, число C_M (t) указывает объем первичных древних текстов от года t, сохранившихся до "момента наблюдения фонда" в год M. График C_M (t) можно условно назвать графиком "остаточного фонда информации", сохранившегося от эпохи (A,B) до года M. Теперь наша модель может быть переформулирована таким образом.

ГРАФИК ОБЪЕМА ОСТАТОЧНОГО ФОНДА C_M (t) ДОЛЖЕН ИМЕТЬ ВСПЛЕСКИ ПРИМЕРНО В ТЕ ЖЕ ГОДЫ НА ИНТЕРВАЛЕ (A,B), ЧТО И ИСХОДНЫЙ ГРАФИК ПЕРВИЧНОГО ФОНДА ИНФОРМАЦИИ C(t).

Разумеется, проверить модель в таком ее виде трудно, поскольку график C(t) первоначального фонда информации сегодня нам точно неизвестен. Но одно из следствий теоретической модели (гипотезы) проверить все-таки можно.

Поскольку более поздние летописцы Х и Y, описывая один и тот же исторический период (А,В) и один и тот же "поток событий", уже не

являются современниками этих древних событий, то они вынуждены

опираться на приблизительно один и тот же набор дошедших до них

текстов. Следовательно, они должны "в среднем" более подробно описать

именно те годы, от которых сохранилось больше текстов, и менее подробно

- годы, о которых сохранилось мало информации. Другими словами, летописцы должны увеличивать подробность изложения при описании тех

лет, от которых до них дошло больше текстов.

На языке графиков объема эта модель выглядит так. Если летописец X живет в эпоху M, то он будет опираться на остаточный фонд C_M (t).

Если другой летописец Y живет в эпоху N, отличную, вообще говоря, от эпохи M, то он опирается на сохранившийся фонд информации C_N (t). См.рис.3.3.

Естественно ожидать, что <<в среднем>> летописцы X и Y работают более или менее добросовестно, а потому они должны более подробно описать те годы из древней (для них) эпохи (A,B), от которых до них дошло больше информации, больше старых текстов.

Другими словами, график объемов vol X(t) будет иметь всплески примерно в те годы, где имеет всплески график C_M (t). В свою очередь,

график vol Y(t) будет иметь всплески примерно в те годы, где делает

всплески график C_N (t). См.рис.3.3.

Но точки всплесков графика остаточного фонда C_M (t) близки к точкам всплесков исходного, первичного графика C(t) . Аналогично, и

точки всплесков графика остаточного фонда C_N (t) близки к точкам

всплесков первичного графика C(t) . Следовательно, графики объемов

летописей X и Y, - то есть графики vol X(t) и vol Y(t), - должны делать

всплески ПРИМЕРНО ОДНОВРЕМЕННО, "в одних и тех же" точках. Другими

словами, точки их локальных максимумов должны коррелировать. См.

рис.3.1.

При этом, конечно, амплитуды графиков vol X(t) и vol Y(t) могут быть существенно различны. См.рис.3.4.

Окончательно ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ формулируется так. Предыдущие рассуждения могут сейчас рассматриваться лишь как

наводящие соображения.

ПРИНЦИП КОРРЕЛЯЦИИ МАКСИМУМОВ:

а) Если две летописи (текста) X и Y ЗАВЕДОМО ЗАВИСИМЫ, - то есть описывают один и тот же "поток событий" исторического периода (A,B) государства Г, - то графики объемов летописей X и Y ДОЛЖНЫ ОДНОВРЕМЕННО ДОСТИГАТЬ ЛОКАЛЬНЫХ МАКСИМУМОВ (ДЕЛАТЬ ВСПЛЕСКИ) на отрезке (А,В). Другими словами, годы, "подробно описанные в летописи Х", и годы, "подробно описанные в летописи Y", должны быть близки или совпадать. См. рис.3.4.

б) Напротив, если летописи Х и Y ЗАВЕДОМО НЕЗАВИСИМЫ, то есть описывают либо разные исторические периоды (А,В) и (C,D), либо разные "потоки событий" в разных государствах, то графики объемов для летописей Х и Y достигают локальных максимумов В РАЗНЫХ ТОЧКАХ. Другими словами, точки всплесков графиков vol X(t) и vol Y(t) не должны коррелировать. См. рис.3.5. При этом считается, что для сравнения двух графиков мы должны предварительно совместить отрезки (А,В) и (C,D) одинаковой длины.

Все другие пары тексты, то есть не являющиеся ни заведомо зависимыми, ни заведомо независимыми, мы условно назовем НЕЙТРАЛЬНЫМИ. Относительно них никакого утверждения не делается.

Этот принцип подтвердится, если для большинства пар реальных, достаточно больших ЗАВИСИМЫХ летописей Х и Y, то есть описывающих

одни и тот же "поток событий", графики объема для Х и Y делают

всплески приблизительно одновременно, в одни и те же годы. При этом

ВЕЛИЧИНА ЭТИХ ВСПЛЕСКОВ МОЖЕТ БЫТЬ СУЩЕСТВЕННО РАЗЛИЧНОЙ.

Напротив, для реальных НЕЗАВИСИМЫХ хроник какая-либо корреляция точек всплесков должна отсутствовать. Конечно, для конкретных

зависимых хроник одновременность всплесков графиков объема может иметь

место лишь приблизительно.

1.3. СТАТИСТИЧЕСКАЯ МОДЕЛЬ.

Грубая идея состоит в следующем. Для количественной оценки близости точек всплесков поступим так. Вычислим число f(Х,Y) - сумму

квадратов чисел f[k], где f[к] - расстояние в годах от точки всплеска

с номером "k" графика объема Х до точки всплеска с номером "k"

графика объема Y. Если оба графика делают всплески одновременно, то

моменты всплесков с одинаковыми номерами совпадают, и все числа f[k]

равны нулю. Рассмотрев достаточно большой фиксированный запас

различных реальных текстов Н и вычисляя для каждого из них число

f(Х,Н), отберем затем только такие тексты Н, для которых это число не

превосходит числа f(Х,Y). Подсчитав долю таких текстов во всем запасе

текстов Н, получаем коэффициент, который, - при гипотезе о

распределении случайного вектора Н, - можно интерпретировать как

вероятность р(Х,Y). Более подробно описание р(Х,Y) см. в [416],

[438], [419], [375]. Если коэффициент р(X,Y) мал, то летописи Х и Y

зависимы, то есть описывают приблизительно один и тот же "поток

событий". Если же коэффициент велик, то летописи X и Y независимы, то

есть сообщают о разных "потоках событий".

Перейдем теперь к более детальному описанию статистической модели. Конечно, для реальных графиков объема одновременность их всплесков может иметь место лишь приблизительно. Для оценки того, насколько одновременно оба графика делают всплески, математический аппарат статистики позволяет определить некоторое число p(X,Y), измеряющее несовпадение лет, подробно описанных в летописи X, и лет, подробно описанных в летописи Y. Оказывается, если рассматривать наблюдаемую близость всплесков обоих графиков как случайное событие, то число p(X,Y) можно рассматривать как вероятности этого события. Чем меньше это число, тем лучше совпадают годы, подробно описанные в X, с годами, подробно описанными в Y. Дадим математическое определение коэффициента p(X,Y).

Рассмотрим интервал времени (A,B) и график объема vol X(t), который достигает локальных максимумов в некоторых точках m_1,...,m_n-1. Мы считаем для простоты, что каждый локальный максимум (всплеск) достигается ровно в одной точке. Эти точки (то есть годы) m_i разбивают интервал (A,B) на некоторые отрезки, вообще говоря, разной длины. См.рис.3.6. Измеряя длины получившихся отрезков (в годах),

то есть измеряя расстояния между точками соседних локальных максимумов

m_i и m_i+1, мы получаем последовательность целых чисел

a(X)=(x_1,...,x_n). То есть, число x_1 - это расстояние от точки A до

первого локального максимума. Число x_2 - это расстояние от первого

локального максимума до второго. И так далее. Число x_n - это

расстояние от последнего локального максимума m_n-1 до точки B.

Эту последовательность можно изобразить вектором a(X) в евклидовом пространстве Rn размерности n. Например, в случае двух локальных максимумов (то есть если n=3), мы получаем целочисленный вектор a(X)=(x_1,x_2,x_3) в трехмерном пространстве. Назовем вектор a(X)=(x_1,...,x_n) ВЕКТОРОМ ЛОКАЛЬНЫХ МАКСИМУМОВ летописи X.

Для другой летописи Y мы получим, вообще говоря, другой вектор a(Y)=(y_1,...,y_m). Будем считать, что летопись Y описывает события на интервале времени (C,D), длина которого равна длине интервала (A,B), то есть B-A=D-C. Чтобы сравнить графики объемов летописей X и Y, мы предварительно совместим друг с другом два отрезка (A,B) и (C,D) одинаковой длины (наложим их друг на друга). Конечно, число локальных максимумов у графиков vol X(t) и vol Y(t) может быть различно. Однако без ограничения общности можно считать, что число максимумов одинаково, а потому векторы a(X) и a(Y) двух сравниваемых летописей X и Y имеют одинаковое число координат. В самом деле, если число максимумов у двух сравниваемых графиков различно, то можно поступить так. Будем считать некоторые максимумыми КРАТНЫМИ, то есть считать, что в этой точке слились вместе несколько локальных максимумов. При этом, длины соответствующих отрезков, отвечающих этим кратным максимумам, можно считать равными нулю. Пользуясь этим соглашением, можно очевидно уравнять число локальных максимумов у графиков объемов летописей X и Y. Конечно, такая операция, - введение кратных максимумов, - неоднозначна. Фиксируем пока какой-либо вариант введения кратных максимумов. В дальнейшем мы избавимся от указанной неоднозначности, минимизировав нужные нам коэффициенты близости по всем возможным способам введения кратных максимумов. Отметим, что введение кратных максимумов означает, что у вектора a(X) на некоторых местах появляются нулевые компоненты, то есть отрезки нулевой длины.

Итак, сравнивая летописи X и Y, можно считать, что оба вектора a(X)=(x_1,...,x_n) и a(Y)=(y_1,...,y_n) имеют одно и то же число координат и поэтому лежат в одном и том же евклидовом пространстве Rn. Отметим, что у каждого из этих векторов сумма его координат - одна и та же и равна B-A=D-C, то есть длине интервала времени (A,B). Итак: