1. Верхоглядство, некомпетентность или подтасовка?
1. Верхоглядство, некомпетентность или подтасовка?
Оппонент утверждает: «Даже после “усовершенствования методики обработки” суммарных данных нам представлено три совершенно разных динамических ряда изменения роста новобранцев за 1851–1895 гг. рождения. Расхождения невелики, однако не следует забывать, что, по словам самого же Миронова, общий итог изменения роста за 1866–1915 гг. составил всего 4,5 сантиметра («Благосостояние», с. 274)» (А.О., с. 132 — здесь и далее ссылка на статью А.О. в «Вопросах истории», 2011, № 5). В доказательство приводится следующая таблица (табл. 15).
На самом деле противоречий нет, а есть либо верхоглядство, либо непрофессионализм, а вероятнее всего, подтасовка со стороны моего критика, так как подобные ошибки он делал в предыдущей статье, и я на них ему указал{282}. Сведения о среднем росте отличаются и должны отличаться, потому что относятся к разным совокупностям — к разным категориям новобранцев и к различному числу наблюдений.
Таблица 15.
Динамика роста (в см) новобранцев 1851—1895 годов рождения по суммарным данным
С. 185: Рост новобранцев в возрасте старше 20 лет по всем суммарным данным (11,7 млн. наблюдений за 1851–1895 гг.).
С. 273. Рост новобранцев по суммарным и индивидуальным данным в возрасте старше 23 лет (индивидуальных данных 50,9 тыс.).
С. 473. Рост всех новобранцев, принятых на действительную службу, по суммарным данным (число наблюдений 2,7 млн.).
Естественно, средние разных совокупностей должны хотя бы немного различаться, поскольку мы работаем с выборками, а выборки имеют стандартные ошибки.
А.О. продолжает. «Расхождения в оценке роста новобранцев 1851–1895 гг. рождения не исчерпываются этим. Вот пять разных показателей за 1851–1860 гг. под одной обложкой: 164,1; 164,5; 164,7; 165,2; 165,6 («Благосостояние», с. 293, 284, 185, 273, 473)».
Снова возникает тот же вопрос: непрофессионализм или подтасовка? Ибо и здесь речь идет о разных совокупностях, с разным числом наблюдений, причем средний рост в них подсчитан по разным методикам в соответствии с потребностями анализа: для новобранцев — это простые средние арифметические, для мужчин — средние референтной группы, оцененные с помощью метода наибольшего правдоподобия.
С. 293. 164,1 см — это рост мужчин, рожденных в 1860-е гг., а не в 1850-е гг., как утверждает А.О.
С. 284. 164,5 см — рост мужчин, т.е. истинный рост мужского населения старше 23 лет (взят из табл. VI. 1 на с. 273 «Благосостояния»).
С. 185. 164,7 см — рост новобранцев старше 20 лет по суммарным данным. В XIX — начале XX в. мужчины росли до 27 лет.
С. 273. 165,2 см — рост референтной группы в 1851–1855 гг. (в возрасте старше 23 лет), а не в 1851–1860 гг., как утверждает А.О.
С. 473. 165,6 см — рост только рекрутов, принятых на действительную службу по суммарным данным. Причем в книге дан рост по пятилетиям, а А.О. объединяет их в десятилетия без взвешивания 5-летних средних по числу наблюдений в каждом пятилетии.
А.О. обнаружил якобы и другие дефекты: «“Пляшут” цифры и в других таблицах. Так, данные из таблиц VI. 1, VI.8, VI. 12 («Благосостояние», с. 273, 284, 293) содержат два не совпадающих динамических ряда за целое столетие: 1801–1810 гг. — 164,0 и 162,7, 1811–1820 гг. — 165,1 и 164,3, 1821–1830 гг. — 164,8 и 164,0, 1831–1840 гг. — 164,6 и 164,5, 1841–1850 гг. — 165,2 и 164,9, 1851–1860 гг. — 165,2 и 164,5, 1861–1870 гг. — 164,8 и 164,1, 1871–1880 гг. — 166,8 и 166,5, 1881–1890 гг. — 167,5 и 167,3,1891–1900 гг. — 165,5 и 166,7» (А.О., с. 132).
Во-первых, цифры «пляшут» настолько, насколько должны «плясать», так как относятся к разным категориям новобранцев. В табл. VI первая цифра — рост новобранцев, вторая цифра — рост мужчин референтной группы. Новобранцы должны быть немного выше мужчин, ввиду существования ростового ценза при наборе в армию. Этому посвящен специальный параграф 3 во 2-й главе, где прямо сказано: «Средние, подсчитанные по выборочным данным, могут существенно отличаться от среднего роста референтной группы»{283}.
Во-вторых, данные о росте в табл. VI.8 за 1801–1860 гг. и в VI.12 за 1861–1913 гг. полностью совпадают с данными о росте мужчин референтной группы в табл. VI. 1 (из «Благосостояния»).
В-третьих, данные в моей табл. VI. 1 приведены по пятилетиям, а А.О. объединяет их в десятилетия без взвешивания 5-летних средних на числе наблюдений в каждом пятилетии. Сконструированных А.О. данных (1-й динамический ряд) в моей книге нет, а поскольку они сконструированы с методическими ошибками, они не могут показать адекватную динамику роста.
«Такая же картина наблюдается и с индивидуальными данными XVIII в.», — утверждает А.О. и составляет таблицу с данными из разных моих работ, написанных в последние 10 лет, 2001–2010 гг. (табл. 16).
Таблица 16.
Динамика роста рекрутов в XVIII в. (см){284}
2001 г. 2003 г. 2004 г. 2005 г. 2010 г. 1701–1710 164,4 164,7 165,0 164,4 164,9 1711–1720 163,4 163,7 163,7 163,8 164,6 1721–1730 163,0 163,3 163,6 163,9 164,1 1731–1740 164,4 164,3 164,3 164,6 164,8 1741–1750 164,8 164,6 164,6 164,9 164,3 1751–1760 163,5 163,3 163,1 164,3 162,6 1761–1770 163,4 163,7 163,6 163,3 164,0 1771–1780 163,3 163,2 163,0 164,5 162,2 1781–1790 161,4 160,9 160,8 161,8 161,0 1791–1800 159,9 160,5 159,5 160,2 162,6В моих работах этих цифр нет. А.О. вновь сочинил данные сам и вновь просмотрел или недопонял: в пяти случаях речь идет о разных категориях рекрутов, о совокупностях с разным числом наблюдений, причем средние в них подсчитаны по разным методиками (в соответствии с потребностями анализа, проведенного на соответствующих страницах моей работы).
Работа Б.М. 2001 г. Данных, приводимых А.О., в моей статье, на которую он ссылается, нет. Это его собственные расчеты. В моей работе приведены данные по пятилетиям 1700–1704, 1705–1709, 1710–1714, 1715–1719 и т.д. А.О. объединяет каждые два пятилетия в десятилетия — 1700–1704 и 1705–1709 гг. в 1701–1710; а 1710–1714 и 1715–1719 гг. в 1711–1720 гг. ит.д., совершая сразу две ошибки. Во-первых. Объединенные пятилетия хронологически дают другую комбинацию годов: не 1701–1710, а 1700–1709, не 1711–1720 гг., а 1710–1719 и т.д. Вследствие этого десятилетия, составленные А.О., отличаются от моих десятилетий на 2 года из 10, т.е. на 20%.
Б.М. 1700–1704 гг. 1705–1709 гг. 1710–1714 гг. 1715–1719 гг. 1720–1724 гг. 1725–1729 гг. ... 1790–1794 гг. 1795–1799 гг. А.О. 1701–1710 гг. 1711–1720 гг. 1721–1730 гг. ... 1791–1800 гг.Во-вторых. А.О. вычисляет средний рост по десятилетиям как среднюю арифметическую двух смежных пятилетий, не учитывая число наблюдений в каждом пятилетии. А следовало средние пятилетние взвесить на числе наблюдений в каждом пятилетии. Поскольку сведений о числе наблюдений в моей цитируемой статье нет, то и среднюю десятилетнюю считать нельзя. Правильно подсчитанный средний рост по десятилетиям приведен в моей работе 2003 г.
Работа Б.М. 2003 г. А.О. совершает те же ошибки. В монографии приведен средний рост по десятилетиям за 1700–1709, 1710–1719, 1720–1729 и т.д., а не за 1701–1710, 1711–1720, 1721–1730 гг. и т.д., как он утверждает. Кроме того, в моем комментарии к табл. XI.9, откуда А.О. взял данные, подчеркивается ориентировочность, приблизительность полученной картины: «Данные не могут рассматриваться как абсолютно точные», «расширение источниковой базы антропометрических исследований в будущем позволит уточнить как периодизацию, так и степень колебаний в длине тела»{285}.
Работа Б.М. 2004 г. Критик вновь конструирует данные, совершая те же ошибки. В моей работе приведены данные по пятилетиям 1700–1704, 1705–1709, 1710–1714, 1715–1729 и т.д. А.О. механически объединяет два пятилетия в десятилетия 1701–1710, 1721–1720 гг. и т.д. Кроме того, он игнорирует важное обстоятельство: в статье 2004 г. при расчете средних я использовал другую методику, чем в ранних работах 2001 г. и 2003 г. На этот раз я рассчитал средний рост с поправкой на вариацию возрастной структуры рекрутов, входивших в выборки (т.е. по единой возрастной структуре); в отдельных случаях это давало несколько иные цифры (в статье это подробно объяснено).
Работа Б.М. 2005 г. И здесь мы имеем конструирование, проведенное с ошибками: А.О. неправильно объединил пятилетия в десятилетия. Он не обратил внимание также на то, что в статье 2005 г. число наблюдений по пятилетиям почти в полтора раза меньше (п = 57 249), чем в статье 2004 г. (п = 82 997)[28]. Естественно, изменение числа наблюдений привело к небольшому изменению величины средних.
Работа Б.М. 2010 г. Пятое конструирование реальности. В моей работе 2010 г. приведены сведения по пятилетиям 1701–1705, 1706–1710, 1711–1715, 1716–1720 гг. и т.д. В данном случае объединить два пятилетия в одно десятилетие можно, но следовало учесть число наблюдений по каждому пятилетию (А.О. этого не сделал). Но более существенно другое: А.О. просмотрел, что в книге использована иная, новейшая методика обработки антропометрических данных, учитывающая цензурированность ростовых данных и различия в составе выборок в отдельные пятилетия. Кроме того, в моих новых расчетах число наблюдений увеличилось на 4666, вследствие чего величины средних в отдельные пятилетия немного изменились.
Таким образом, никаких разногласий и противоречий в данных, приведенных мною в разных работах за последние 10 лет, нет. Цифры среднего роста в некоторых случаях несущественно различаются по трем причинам: изменялась хронология пятилетий и десятилетий (1701–1705 гг. вместо 1700–1704 гг. и т.д. или 1701–1710 гг. вместо 1700–1709 гг. и т.д.), совершенствовалась методика обработки антропометрических данных и увеличивалось их число.
Подчеркну: процесс корректировки полученных мною средних показателей роста будет продолжаться по мере того, как число вводимых в научный оборот данных будет увеличиваться. Не случайно в каждой моей работе это особо и обстоятельно объясняется. «Сразу оговоримся, что полученные статистические результаты и соответственно сделанные на их основе выводы носят предварительный характер, так как работа по созданию базы данных продолжается», — писал я в статье 2004 г. Однако коррекция не существенна: выводы относительно тенденций в динамике роста, которые я сформулировал в ранних работах, в принципе не изменялись вплоть до настоящего времени. Просто в каждой новой работе они становились более корректными.
Пусть читатель сам судит, с чем мы имеем дело во всех перечисленных случаях — с верхоглядством, некомпетентностью, намеренной фальсификацией или, может быть, с идеологической слепотой под влиянием когнитивного диссонанса[29], ибо основания имеются для любого заключения.
А.О. сетует: «Методика “усеченной выборки”[30] не объяснена в монографии. Там сказано лишь, что эта проблема “решается по-разному” и что «в настоящее время в исторической антропометрии принято» считать оптимальным решением “метод максимального правдоподобия”, когда “по известной части распределения” восстанавливают отсеченную часть, “благодаря тому, что нам известен нормальный закон распределения роста и точка усечения” («Благосостояние», с. 103). Этот аргумент может быть принят во внимание только в том случае, если автор а) изложит суть названного им закона, б) укажет, когда, кем и на основании чего он был открыт, в) приведет доказательства его общепризнанности» (А.О., с. 130).
В действительности необходимые в историческом сочинении сведения о нормальном распределении, усеченной выборке и методе максимального правдоподобия приведены в книге{286}. Проверка нормальности распределения антропометрических данных осуществлена в специальном параграфе{287}. Важнейшая современная литература, посвященная исторической антропометрии (более сотни названий см. в Списке источников и литературы, приложенном к книге) и методике работы с усеченной выборкой в антропометрических исследованиях, приведена, правда, только иностранная «буржуазная», поскольку отечественные статистики этой проблеме пока не уделили должного внимания{288}.
Проблема закона нормального распределения рассматривается во всех курсах статистики на исторических факультетах российских университетов, в частности Петербургского. Есть стандартный учебник, подготовленный на историческом факультете МГУ, где этот вопрос достаточно подробно освещен{289}. Наконец, в наше время необходимую справочную информацию как о нормальном распределении, так и об усеченной выборке и методе максимального правдоподобия легко найти в Интернете, хотя бы в Википедии, — на любой вкус и с любой степенью сложности.
Нельзя, однако, не заметить: нормальное распределение занимает центральное место в теории и практике вероятностно-статистических исследований в течение последних двух столетий. О нем говорится в любом учебнике по статистике. Требовать «доказательства его общепризнанности» — это все равно, что требовать доказательства общепризнанности закона всемирного тяготения, теории эволюции Дарвина, вращения Земли вокруг Солнца и т.п. А если человек в этом не разбирается, то зачем браться за экспертизу книги, являющейся статистическим исследованием?!
А.О. продолжает упрямо настаивать на том, будто уменьшение ростового ценза, наблюдавшееся в России XIX в., свидетельствует о снижении роста населения (А.О., с. 130). В книге неоднократно говорится и доказывается: оценка среднего роста методом максимального правдоподобия в принципе устраняет влияние ценза на рост. Поэтому не имеет значения ни сам факт понижения ценза, ни то, по какой причине уменьшался ростовой ценз. Спорить об этом, значит, либо извратить суть спора, направить его по ложному пути, подменять принципиальные вещи — второстепенными деталями, либо не понимать дело по существу.
Сам же ростовой ценз оказывал влияние на рост новобранцев, но не столь существенное, как воображает А.О. В моем распоряжении данные о 37 503 рабочих, родившихся в интервале от 1853 г. до 1915 г. в возрасте старше 20 лет, попавших в выборку без ростового ценза. Их средний рост составил 166,8 см. Если из них выделить тех, числом 36 939 человек, кто соответствовал ростовому цензу 153,4 см, введенному военной реформой в 1874 г., то их средний рост уменьшится лишь на 0,3 см. Однако оказывая, пусть и незначительное, влияние на средний рост новобранцев в выборке, ростовой ценз не влияет ни на рост мужчин в генеральной совокупности, ни на рост референтной группы, на основе которого я оцениваю динамику роста всего населения. Как бы ни варьировал ростовой ценз, метод максимального правдоподобия это учитывает, поэтому величина ростового ценза не сказывается на итоговых результатах, как утверждает А. О.
А.О. обнаружил якобы ужасные противоречия: в одном случае я говорю, что моя база антропометрических данных насчитывает 10,3 млн. данных, в другом — 11,7, в третьем — 12,7 млн. (А.О., с. 133). И по-прокурорски требует объяснения — откуда такие расхождения, намекая на грандиозный обман — шуточное ли дело 2,4 млн. новых наблюдений?! Я уже объяснял в ответе на первую его статью: 10,3 млн. относятся к России без национальных окраин в 1701–1920 гг., 11,7 млн. — ко всей территории империи. Третья цифра, 12,7 млн. наблюдений, включает не только период империи, но и весь XX век., т.е. 1701–2000 гг.
По мнению А.О., я неправильно соединяю динамические ряды длины тела за 1701–1852 гг. и 1853–1892 гг. и манипулирую методикой расчета среднего роста за 1853–1892 гг. по суммарным данным, вследствие чего создается ложная картина динамики среднего роста населения не только в пореформенное время, но и, возможно, в период империи в целом. Несмотря на все мои старания, оппонент так и не уяснил: какой бы методикой ни пользоваться при расчете средней арифметической, позитивный тренд в динамике за 1853–1892 гг. не станет негативным. Может измениться только абсолютная величина роста, но за все годы периода и на одну и ту же величину (будь то 2,4 или 4,5 см). Если допустить, что я некорректно соединяю 1701–1852 гг. и 1853–1892 гг. в единый динамический ряд или эти два ряда не являются однородными и их в принципе нельзя соединять в один, то их придется анализировать автономно один от другого. Но и в этом случае обнаруженные тренды в изменении среднего роста не подвергнутся корректировке, т.е. позитивный тренд как в 1796–1855 гг., так и в 1866–1915 гг. все равно сохранится. Более того, сама величина увеличения длины тела за 1866–1915 гг. будет одинаковой при любой методике его расчета, поскольку от нее не зависит. Путаные рассуждения и намеки на злонамеренное манипулирование данными (А.О., с. 131–132) имеют целью увести читателя в сторону от проблемы и бросить тень сомнения на результаты.