А.Ю.Андреев: «Теория ошибок и ошибки теории А.Т.Фоменко»

Форум » История дореволюционной России » А.Ю.Андреев: «Теория ошибок и ошибки теории А.Т.Фоменко» » Ответить

А.Ю.Андреев: «Теория ошибок и ошибки теории А.Т.Фоменко»

Вершинин Владимир: В.Вершинин А.Ю.Андреев: «Теория ошибок и ошибки теории А.Т.Фоменко» (опубликовано 02.10.2005 на сайте «Полемика и дискуссии») В прошлый раз я предложил читателям ознакомиться с мнением академика А.А.Маркова о некоторых статистических исследованиях Н.А.Морозова - предтечи А.Т.Фоменко (см. полемические заметки к статье Г.Елисеева «От Морозова к Фоменко»). Однако это не даёт точного и полного представления о математических основах метода самого Фоменко и способе его применения Фоменко к исторической хронологии. А ведь именно здесь и «зарыта собака», которую не видит подавляющееся большинство читателей «новой хронологии» либо в силу невладения необходимым математическим аппаратом, либо в силу естественного доверия академику-математику. Уже довольно давно и не раз меня посещала мысль о необходимости приемлемого для широкого круга читателей изложения критики математических основ метода Фоменко именно с точки зрения самой математики. И только совсем недавняя дискуссия по поводу «новой хронологии» на одном из Интернет-форумов подвигла меня на то, чтобы проделать такую работу. Но сначала немного истории. 4-5 лет тому назад я увидел увлечение некоторых своих сослуживцев «новой хронологией» Фоменко. Я, конечно, и раньше слышал о его «достижениях» в истории, но впервые наблюдал такое увлечение вблизи. Ясно, что для того, чтобы понять выводы какой-либо научной концепции, необходимо удостовериться в прочности её фундамента, то есть используемого метода и обоснованности его применимости к реальному процессу (в случае с Фоменко – к истории). Поэтому, первое, что я сделал - это приобрёл одну из книг Фоменко, где (пусть кратко) излагается его метод «локальных максимумов» и приведены конкретные результаты расчётов. Однако, увидев в этой книге числа порядка 10^(-10), я насторожился, а в процессе дальнейшего чтения эта настороженность переросла в устойчивое: здесь что-то не так. Пришлось обратиться к математическим основам метода Фоменко, посмотрев его работу «Некоторые статистические закономерности распределения плотности информации в текстах со шкалой» (1980 г.), в которой и описана математическая модель его хронологии. Так! Значит мы попали в область математической статистики. И хотя я алгебраист, но понял, что с формально-математической точки зрения к модели Фоменко претензий нет. Однако… Где обоснование применимости этой модели к реальным историческим текстам? Где оценка достоверности получаемых результатов? Ведь математическая статистика давно обладает такими методами. Где, наконец, сравнение результатов применения модели Фоменко к историческим текстам, с результатами, которые могут быть получены методами математической статистики? Ничего этого у Фоменко я не обнаружил. Оставалось либо самому провести необходимый математический анализ, либо поискать работы других математиков, уже сделавших это. Мои поиски таких работ довольно быстро увенчались успехом: их оказалось даже больше одной. Первой из них была статья А.Ю.Андреева «Теория ошибок и ошибки теории А.Т.Фоменко» (1999 г.), «популярную» обработку которой я здесь и предлагаю. Качество проделанной мной работы оценит, конечно, читатель, но в любом случае я надеюсь, что приведённые здесь результаты и выводы Андреева позволят лучше понять суть «фокуса» Фоменко. Те из читателей, у которых даже простые математические понятия и формулы вызывают «неприятные» ассоциации, могут читать, начиная с п.4. * * * 1. Сначала вслед за Андреевым напомним основные понятия математической статистики. Статистические методы позволяют обобщить точную информацию о каждом отдельном элементе из некоторого множества, называемого генеральной совокупностью, до нескольких общих показателей, характеризующих генеральную совокупность в целом (типичный пример из физики: газ - генеральная совокупность, молекулы - ее элементы, давление, плотность, температура - обобщенные показатели). На практике часто возникает обратная задача: известны именно обобщенные показатели, и по ним необходимо сделать заключение об индивидуальных свойствах выбранного элемента генеральной совокупности (например, по давлению и плотности газа оценить скорость одной его молекулы). Таким образом, суть статистики - в умении преобразовывать информацию о генеральной совокупности «в обе стороны»: от индивидуальных свойств к общим и наоборот, от общих к индивидуальным. Однако в последнем случае правильный результат можно получить лишь с определенной долей вероятности. Поясним на том же примере - статистическая оценка для скорости произвольной молекулы газа в большинстве случаев будет довольно точной, но иногда - неудовлетворительной, так как настоящая скорость выбранной молекулы окажется в несколько раз больше предсказанной. Иначе говоря, каждое предсказание содержит ошибку по сравнению с реальным значением, и хотя чаще всего эта ошибка будет малой, случаи больших ошибок также неизбежно встречаются. Тогда вероятность выполнения некоторой статистической гипотезы (например, того, что мы можем предсказать скорость молекулы с относительной ошибкой не больше 100%) определяется с помощью последовательности испытаний. Эта вероятность равна отношению количества испытаний, в которых гипотеза оказывается верной (скорость выбранной молекулы предсказана с нужной точностью) к общему числу испытаний. Типичной статистической гипотезой, нуждающейся в такой вероятностной проверке, является гипотеза о взаимосвязи двух признаков X и Y, измеренных и представленных в виде вариационных или динамических рядов X[j] и Y[j], 1 <= j <= n, (наборов чисел – результатов испытаний). Простейшим статистическим методом, который проверяет такую взаимосвязь, является вычисление коэффициента линейной корреляции r (математическая статистика предлагает и другие статистические коэффициенты). Как же определить, зависимы признаки X и Y или нет? Ответ существует, хотя и носит вероятностный характер. Где же граница, отделяющая область значений коэффициента линейной корреляции r, свидетельствующих о зависимости признаков X и Y, от области, где эти признаки независимы? Cтатистически грамотно сначала выбрать некоторую вероятность Р (например, 0.95 - 95 случаев из 100), с которой, как мы хотели бы, выполнялась гипотеза о зависимости признаков, и затем определить, какие значения коэффициента линейной корреляции r этому соответствуют. Оценка, которую здесь предлагает статистика, такова: |r| > t / (n^(1/2)) , где t зависит от Р и вычисляется с помощью интеграла вероятности. Правая часть приведённого неравенства определяет уровень значимости коэффициента линейной корреляции r. Если вычисленное по экспериментальным данным X[j] и Y[j] значение |r| больше, чем этот уровень, то гипотеза о взаимосвязи признаков верна с заданной вероятностью Р. Понятие об уровне значимости является одним из самых фундаментальных в статистике. Именно с этим понятием связана возможность как-то интерпретировать полученные результаты. Без вычисления уровня значимости число, посчитанное, например, как коэффициент корреляции, так и остается просто числом, ничего никому не говорящим. Представьте себе, что мы взяли два ряда X[j] и Y[j], вычислили коэффициент r и получили ответ «r=0,6». О чем это свидетельствует? - Пока еще, ни о чем! Только если мы зададимся некоторой желательной для нас вероятностью, с которой взаимосвязь должна существовать, а затем вычислим по формуле t / (n^(1/2)) уровень значимости, только тогда мы можем сделать вывод – да, взаимосвязь признаков X и Y есть, или нет, с такой вероятностью о ее существовании говорить нельзя. Только корректная интерпретация результатов вычислений придает математическим процедурам научный вес и смысл. Около 30 лет в исторической науке существует самостоятельный раздел «Количественные методы в исторических исследованиях» («клиометрика»). Сегодня в этом разделе применяются и компьютерные технологии. Регулярно собираются международные и отечественные конференции, публикуются результаты исследований. На историческом факультете МГУ действует ядро ассоциации «История и компьютер», объединяющей историков на всей территории бывшего СССР, которая сама входит в международное сообщество историков-клиометристов. Труды «первопроходцев» в этой области (например, работы академиков И.Д.Ковальченко и Л.В.Милова по аграрной истории России) уже давно сделались классическими. И это стало возможным потому, что историки значительную часть времени и сил потратили не на вычисления, а на задачу - правильно интерпретировать и понять полученные результаты, обосновать их достоверность и научную значимость. 2. Далее Андреев анализирует так называемый метод «локальных максимумов» Фоменко, призванный сравнить два текста с хронологическим изложением событий по годам (летописи или хроники) и установить их зависимость друг от друга. Суть метода сводится к следующему. Вначале, по погодной сетке для каждого текста строится график «содержания информации». В нем каждому значению года соответствуют «объем исторической памяти» о нем. Эта память измеряется Фоменко в количестве страниц (!), соответствующих этому году (зависит от издания книги и шрифта?!), или в количестве слов погодной записи (зависит от языка?!), собственных имен, букв и т.д. По мнению Фоменко (без какого-либо обсуждения!) все это приводит к одному и тому же графику. На втором шаге из графика выбираются точки «максимумов информации». Однако неясно, каким четким требованиям должны удовлетворять эти «максимумы», для которых на практике берутся далеко не все вершины графика. Вызывает вопросы и другое обстоятельство - максимум в этом методе всегда достигается в одной точке (то есть в конкретном году), но тогда где поставить максимум, если в источнике с одинаковой подробностью описаны два или более года подряд? Его датировка будет колебаться в пределах нескольких лет. Затем, чтобы избавиться от «случайных» максимумов, Фоменко предлагает применять сглаживание (усреднение информации по соседним точкам), которое также может сдвигать положение максимума на один - два года. Ясно, что здесь открывается большая свобода в привязке максимума к конкретной дате «плюс-минус несколько лет», что само по себе незначительно, но для последующих вычислений играет большую роль, так как они оказываются сверхчувствительными к таким «малым» изменениям. Наконец, две хроники могут сравниваться, только если у них одинаковое число максимумов на временном отрезке одинаковой длины. Эти условия (равенство числа максимумов и совпадение длин сравниваемых хроник) очень важны в последующей вычислительной схеме. Если они исходно не выполнены, то из хроник выбираются части одинаковой длины, а если максимумов в одной из них не хватает, то недостающие воображаются слившимися с уже имеющимися. Такая процедура выбора «слившихся максимумов», предложенная Фоменко исключительно из требований своего вычислительного метода и не имеющая никакого смысла в истории, также является неоднозначной, но при этом сильно влияет на ход расчетов. Итак, «на выходе» из каждого текста (хроники) получается последовательность лет, о которых сохранился максимум информации, например, на 450-летнем отрезке выделяется 14 таких дат. Далее от этого набора максимумов Фоменко переходит к числовому ряду, где каждое число X[j] равно длине (в годах) промежутка времени между соседними максимумами. В нашем примере 14 максимумов делят временной отрезок на 15 интервалов, то есть в итоговом ряду X[j], соответствующем этой хронике - 15 чисел. Если итоговые ряды у двух хроник «похожи», то Фоменко считает, что хроники на самом деле описывают одни и те же факты истории, являясь их «дубликатами», приписанными к разным эпохам. Один из доказанных таким образом базовых результатов «новой хронологии» - это совпадение максимумов хроник древнеримской «Истории» Тита Ливия и средневековой римской «Истории» Ф.Грегоровиуса, что влечет за собой утверждение о том, что античный и средневековый Рим - тождественные события, ошибочно «сдвинутые» хронологами. Заметим пока только логическую слабость этих выводов. Ведь история - это не только последовательность дат. Метод Фоменко полностью игнорирует сравнение содержательной стороны событий. То есть, «если кости похожи, то и рыбы одинаковы». 3. Основная статистическая задача метода Фоменко - определить, являются ли построенные из двух хроник X и Y числовые ряды X[j] и Y[j] зависимыми. Задача вполне стандартная и статистика хорошо изучила множество способов ее решения. Почему, например, не использовать все тот же коэффициент линейной корреляции r? Но Фоменко предлагает свой собственный способ. По построению, ряды подчинены следующим условиям: а) равенство количества членов в рядах X[j] и Y[j] (для n максимумов это количество равно (n+1)) и б) равенство полных длин хроник, которое можно записать как X[1]+X[2]+…+X[n+1]=Y[1]+Y[2]+…+Y[n+1] =A (поскольку X[j] и Y[j] - это длины отрезков, на которые максимумы делят соответствующие хроники, то сумма этих длин равна полной длине хроник, которая обозначена A). Исходя из этих условий, Фоменко применяет нестандартный для статистики прием: при вычислении своего коэффициента он рассматривает ряды X[j] и Y[j] как наборы координат двух точек X и Y в (n+1)-мерном пространстве. Это многомерное пространство существует по тем же законам, что и обычное, трехмерное, только вместо трех координат у каждой точки - ровно (n+1) координат. Евклидово расстояние между точками также вводится обычным способом: корень квадратный из суммы квадратов разностей X[j]-Y[j]. Умея вычислять расстояние между любыми точками, можно сказать, какие точки находятся ближе, а какие дальше от некоторой выбранной нами. На этом и построен коэффициент, измеряющий зависимость хроник. Фоменко предлагает вначале рассмотреть множество всех «виртуальных» хроник X данной длины, то есть всех рядов X[j], удовлетворяющих условию X[1]+X[2]+…+X[n+1]=A с учетом того, что все X[j] - неотрицательные целые числа. Затем, выбрав из этого множества точку X, соответствующую одной из исследуемых хроник, подсчитать, сколько «виртуальных» хроник находится по отношению к точке X не дальше, чем вторая исследуемая хроника Y. Наконец, разделить это количество на полное число «виртуальных» хроник, и тогда получится искомая «мера зависимости» хроник, названная Фоменко ВССЛ (вероятность случайного совпадения лет). Если расстояние между хрониками X и Y мало, то и соответствующие координаты X[j] и Y[j] должны быть почти равными, т.е. максимумы хроник близки и эти хроники, наверняка, зависимы. Таким образом, если коэффициент ВССЛ мал по сравнению с единицей, то мы должны считать хроники X и Y зависимыми. Всё это верно, однако нет ответа на главный вопрос: насколько малым должен быть коэффициент ВССЛ, чтобы достоверно говорить о зависимости хроник? Поражают приводимые Фоменко значения ВССЛ [они то и насторожили меня в единственной прочитанной мной книге Фоменко – В.В.]: например, «вероятность случайного совпадения» хроник равна 10^(-10), т.е. одна десятимиллиардная! Иными словами, с вероятностью ошибки всего в одном случае из десяти миллиардов Фоменко утверждает, что выбранные хроники зависимы, их события тождественны, а значит и эпохи совпадают, найдены хронологические сдвиги и т.д. Невероятная точность! Но соответствует ли она действительности? Андреев показывает, что нет. Во-первых, вероятностная интерпретация коэффициента ВССЛ неверна. Дело в том, что «виртуальные» хроники и числовые ряды, получаемые из реальных хроник не находятся во взаимнооднозначном соответствии. Несколько «виртуальных» хроник (в конкретных примерах - это тысячи и миллионы) могут отвечать всего одной реальной хронике, а могут и вообще не соответствовать никакой. Во-вторых, раз ВССЛ - это не вероятность случайного совпадения лет в хрониках, то нужно разобраться, откуда берутся столь малые значения этого коэффициента. Андреев приводит верхнюю границу значений ВССЛ (эта формула есть и в упомянутой работе Фоменко 1980 г.), в которую множителем входит число p / A < 1 (p – это расстояние между хрониками), возведённое в степень n, равную количеству максимумов, т.е. достаточно большому числу (например, 15). Иными словами, малые значения ВССЛ - всего лишь результат «числовой игры», заменяющей расстояние между хрониками его малым отношением, возведенным в большую степень. Другие следствия этой «игры» - колоссальная чувствительность коэффициента ВССЛ к изменению положения хотя бы одного из максимумов, к добавлению или исчезновению максимума. Причем существует закономерность - чем меньше значение ВССЛ (то есть чем достоверней кажется зависимость хроник), тем к большим изменениям в его значении приводит даже небольшая подвижка максимума хотя бы на один год. Это возвращает нас к вопросу: где граница, отделяющая значимый результат от незначимого? Как найти уровень значимости для коэффициента ВССЛ? Нельзя сказать, что Фоменко совсем ничего не сделал в этом направлении. В своей книге ему необходимо было привести значения ВССЛ, которые он считает значимыми для зависимых хроник. Но для этого он ссылается не на расчеты, а на некий «вычислительный эксперимент». По информации Фоменко, его вычислительный эксперимент, проводившийся для хроник с числом максимумов от 10 до 15, показал следующее: а) если хроники зависимы, то их ВССЛ не превосходит 10^(-8); б) для независимых текстов ВССЛ колеблется в пределах от 10^(-2) до 1. На основании этого Фоменко использует значение 10^(-8) как уровень значимости своего коэффициента ВССЛ. Так, например, получив при сравнении хроник Тита Ливия и Грегоровиуса ВССЛ порядка 6*10^(-10), он с уверенностью заявляет о зависимости этих хроник. Однако, следует ли из эксперимента, что любые две хроники (с тем же числом максимумов), у которых ВССЛ не превосходит 10^(-8) являются зависимыми? Действительно, для зависимых хроник коэффициент ВССЛ меньше 10^(-8), но ведь обратное утверждение не доказано! На протяжении нескольких страниц Андреев проводит математический анализ свойств фоменковского коэффициента ВССЛ и показывает, что для параметров вычислительного эксперимента Фоменко, хроники действительно, с достоверностью, могут считаться зависимыми, если их ВССЛ меньше значений 10^(-13)-10^(-14) (при количестве локальных максимумов от 10 до 15 соответственно). Однако, ни одно из указанных в книгах Фоменко «замечательных совпадений» не опускается до этой границы. Наоборот, для них ВССЛ существенно больше. Поэтому, с точки зрения математической статистики и вопреки утверждениям Фоменко, ни одну из рассмотренных им пар нельзя с какой бы то ни было достоверностью считать зависимыми хрониками. 4. Начиная со своей первой монографии, Фоменко ссылается на вычисление коэффициента ВССЛ между хроникой средневековой истории Рима, изложенной Ф.Грегоровиусом (на отрезке с 300 г. по 760 г. н.э.) и «Историей от основания города» Тита Ливия (на отрезке с 1 до 461 г. от основания Рима, т.е. с 753 по 293 г. до н.э.). Найденное им значение ВССЛ равно 6*10^(-10). Тем самым, с почти «абсолютной» достоверностью события средневековой и античной истории Рима совпадают, являясь историческими «дубликатами» со сдвигом в 1053 г. В издании своей монографии «Методы статистического анализа исторических текстов» (1999 г.) Фоменко приводит функции объема информации от каждого года для обеих хроник, которыми он пользовался. Андреев проверяет эту функцию для «Истории» Тита Ливия по тому же изданию этого исторического источника, которым пользовался и Фоменко, и нашёл до 30 ошибок, связанных с неправильным чтением источника. Из этого количества 14 ошибок привели к тому, что положение соответствующего максимума было датировано неправильно. Основные типы ошибок - это пропуск максимума или, наоборот, появление ложного максимума из-за неспособности заметить новые выборы консулов или просто по невнимательности, когда Фоменко не видит даты на полях книги, а также исчезновение максимумов при «усреднении», то есть искусственном и весьма широком сглаживании максимумов, которые без сглаживания отчетливо видны на графике функции объема. Андреев приводит список обнаруженных им ошибок с подробными комментариями. Результат анализа Андреевым пары «Ливий-Грегоровиус» таков. Максимумы Ливия после исправления ошибок Фоменко: 10-30, 83-90, 176, 244-247, 259-260, 294, 305, 308-309, 351, 358, 364, 369, 411-414, 429, 433-434, 444, 458-461. Их оказывается 17, и коэффициент ВССЛ с максимумами Грегоровиуса не падает ниже, чем 10^(-2). Даже если провести очень «широкое» сглаживание и, в соответствие с Фоменко, объединить максимумы 358, 364, 369 в один широкий максимум «галльской войны» 358-369, максимумы 305 и 308-309 - в широкий максимум «децемвиров» 304-310, а максимумы 429, 433-434 - в максимум 429-434 («самнитские войны»), то и тогда окончательный набор 13 максимумов 10-30, 83-90, 176, 244-247, 259-260, 294, 304-310, 351, 358-369, 411-414, 429-434, 444, 458-461 будет отличаться от данного Фоменко. Для последнего набора коэффициент ВССЛ для пары «Ливий-Грегоровиус» находится в пределах 10^(-3)-10^(-2), то есть на границе коэффициента, характерного для независимых текстов. 5. Выводы: а) Фоменко систематически завышает уровень значимости своего коэффициента ВССЛ на несколько порядков. Андреев исправил эту ошибку и нашёл истинный уровень значимости, который равен не 10^(-8), а 10^(-16) для 13-15 максимумов хроники. Он оказался гораздо ниже всех «совпадений», описанных в «новой хронологии» Фоменко. б) Этот уровень значимости коэффициента ВССЛ также является весьма неустойчивым из-за его «сверхчувствительности». При малых неточностях в датировке максимумов (±1 год), которые неизбежны по методике Фоменко, значение ВССЛ может возрасти от 10^(-16) до 10^(-14) (в 100 раз!) и оказаться за границей уровня значимости. Все это говорит о неэффективности применения предложенного Фоменко метода для решения рассматриваемой статистической задачи. Иными словами, в параметрах его вычислительного эксперимента корректное применение метода «локальных максимумов» невозможно. Этот вывод можно обобщить и на другой метод, применённый Фоменко - расчет «совпадения» династий правителей, где вычислялась «вероятность случайного совпадения династий» (коэффициент ВССД). Математические трудности в интерпретации ВССЛ и ВССД вполне схожи. Поэтому аналогичный приведённому выше результат при анализе династических совпадений был получен в работе М.Л.Городецкого «Династические параллелизмы в “новой хронологии”» (1999 г.), в которой показано, что количество независимых династий с малыми ВССД во много раз превышает количество зависимых. * * * Надеюсь, что теперь читателю более понятна суть «фокуса» Фоменко: предложенная им математическая модель (метод «локальных максимумов») некорректно применена к реальному процессу – исторической хронологии. Понятно, что при таком подходе результат применения модели может быть любым. Следовательно, хотя в истории есть «белые пятна» и Фоменко, возможно, что-то и угадал, его метод ничего достоверного не может «сказать» о том, что именно. Таким образом, в несуразности «новой хронологии» виновата не математика, а недобросовестное её применение. Учитель Фоменко (как математика) академик С.П.Новиков в своей статье «Математики — геростраты истории?» (1996 г. ) высказал резко негативное отношение к «исторической» деятельности Фоменко. Опасность здесь не только в «уничтожении» истории, но и в дискредитации математики. И я с Новиковым полностью согласен! И, наконец, последнее. Успех любой научной концепции в её соответствии природе, реальной действительности, что проверяется практикой (экспериментом, историческими источниками и т.п.). Фоменко «уничтожил» историю, то есть реальную действительность, данную нам в исторических документах. Это открывает дорогу не только историческим спекуляциям, но и гностицизму, откуда прямой путь к мировоззренческим антисистемам.

Ответов - 0

полная версия страницы