euthanasepam: G (G)
Кабінет психопатологічної евтаназіології ([personal profile] euthanasepam) wrote2022-07-31 06:58 pm

Про нормальний розподіл, або Як математика та статистика «демістифікують» складне

 



На дозвіллі неквапно читаю одну книжку, яку давно хтів порекомендувати, але якісь непозбувні бентеги ставали на заваді. Оце нарешті тепер пишу про неї та з неї одну цитату.

Це науково-популярна книжка фізика Маріо Лівіо, що в перекладі москвосуржем називається «Был ли Бог математиком? Галопом по божественной Вселенной с калькулятором, штангенциркулем и таблицами Брадиса».

Здибати її можна в інтернеті:

libgen.is/search.php?req=Был+ли+Бог+математиком

rutracker.org/forum/tracker.php?nm='Был ли Бог математиком'

flibusta.is/booksearch?ask='Был+ли+Бог+математиком'


Я читаю, мабуть, оцю:

flibusta.is/b/449291



Далі уривок.


Средний человек

Адольф Кетле родился 22 февраля 1796 года в древнем бельгийском городе Генте[86]. Его отец, городской чиновник, умер, когда Адольфу было всего семь лет. Кетле был вынужден сам зарабатывать себе на жизнь и уже в 17 лет стал преподавать математику. В свободные от учительских обязанностей время он сочинял стихи, написал либретто оперы, поучаствовал в создании двух пьес и перевел несколько художественных произведений. При всем при том его любимым предметом осталась математика, и он первым закончил Гентский университет со степенью доктора наук. В 1820 году Кетле был избран членом Королевской академии наук в Брюсселе и вскоре стал принимать активнейшее участие в ее деятельности. Следующие несколько лет были посвящены в основном преподаванию и публикации нескольких трактатов по математике, физике и астрономии.

Первую лекцию по истории науки Кетле обычно начинал следующим глубоким наблюдением: «Чем сильнее развиваются науки, тем дальше они вступают в сферу влияния математики, которая становится словно бы центром, к которому они стягиваются. О том, какого совершенства достигла та или иная наука, можно судить по тому, с какой легкостью ее результаты можно получить путем вычисления».

В декабре 1823 года Кетле за государственный счет направили в Париж, в основном для изучения наблюдательных методов астрономии. Однако оказалось, что трехмесячный визит в тогдашнюю математическую столицу мира направил Кетле в совершенно другую сторону — к изучению теории вероятности. А пламенный интерес к этой теме разжег у Кетле не кто-нибудь, а сам Лаплас. Впоследствии Кетле так писал о своем опыте работы в статистике и теории вероятности (Quetelet 1828).

Случай — это таинственное слово, которое так часто употребляют не к месту — нужно понимать лишь как прикрытие для невежества, это фантом, захвативший абсолютную власть над заурядным умом, привыкшим рассматривать события исключительно в изолированном виде, но рассыпающийся в прах перед философом, чей кругозор охватывает длинную череду событий и чья проницательность не отвлекается на мелкие отклонения, которые исчезают, стоит ему встать на нужную точку зрения и распознать законы природы.


Трудно переоценить значение этого вывода. В сущности, Кетле отрицает роль случая и заменяет его смелым, хотя и не вполне доказанным, предположением, что причины есть даже у общественных феноменов и что закономерности, проявляющиеся в статистических результатах, можно использовать для выявления законов, лежащих в основе общественного порядка.

В попытке проверить свой статистический подход Кетле отважился на масштабное начинание — стал собирать коллекцию из тысяч измерений различных параметров человеческого тела. Например, он изучал распределение обхвата груди 5738 шотландских солдат и рост 100 000 французских призывников, отдельно прослеживая частоту, с которой встречается каждая человеческая черта. Иначе говоря, он графически выразил, сколько призывников имеют рост, скажем, от пяти футов до пяти футов двух дюймов, сколько — от пяти футов двух дюймов до пяти футов четырех дюймов и т. д. В дальнейшем он построил подобные кривые даже и для «моральных», по его выражению, черт, для которых удалось набрать достаточно данных. В число этих качеств входили самоубийства, браки и склонность к правонарушениям. К своему изумлению, Кетле обнаружил, что все человеческие характеристики следовали так называемому нормальному распределению частоты в виде колокольчика (рис. 33). Эту линию также не вполне заслуженно называют гауссианой в честь «князя математики» Карла Фридриха Гаусса. Что бы ни измерял Кетле — рост, вес, длину конечностей и даже интеллектуальные качества, определяемые лучшими на тот момент психологическими тестами, — у него раз за разом получалась одна и та же кривая. Для Кетле она была не в новинку: математики и физики знали ее, еще начиная с середины XVIII века, и Кетле был с ней знаком еще по астрономическим наблюдениям, так что некоторой неожиданностью для него стала лишь связь этой кривой с чертами и качествами человека. Раньше эту кривую называли кривой ошибок, поскольку она появлялась при исследовании всякого рода ошибок и погрешностей в измерениях.

[Тут у книжці малюнок із графіком кривої нормального розподілу.]


Представьте себе, например, что вам хочется очень точно измерить температуру жидкости в сосуде. Можно взять точнейший термометр и на протяжении часа сделать тысячу последовательных измерений. Окажется, что из-за случайных ошибок, а может быть, и некоторых колебаний температуры не все результаты будут одинаковы. Скорее, все результаты скопятся вокруг какого-то центрального значения, но иногда температура окажется чуть выше, иногда чуть ниже. Если записать, сколько раз среди измерений встретилось то или иное значение, получится та самая кривая в виде колокольчика, которая, как выяснил Кетле, также описывает черты и качества человека. Более того, чем больше измерений той или иной физической величины будет проделано, тем точнее полученное распределение частот приблизится к нормальной кривой. Непосредственный вывод, который напрашивается из этого при ответе на вопрос о непостижимой эффективности математики, сам по себе поразителен: оказывается, строгим математическим законам подчиняются даже человеческие ошибки!

Кетле сделал и более смелые выводы. Он решил, что если черты и качества человека описываются кривой ошибок, значит, «средний человек» — это тип, который природа стремится породить[87]. По мысли Кетле, подобно тому, как при производстве гвоздей погрешности изготовления приводят к некоему распределению колебаний длины гвоздя возле средней (правильной) длины, ошибки природы распределены вокруг некоего предпочтительного биологического типа. Кетле объявил, что представители одного народа стремятся к какому-то среднему показателю, «словно результаты измерений одного и того же человека при помощи инструментов, грубость которых объясняла бы разброс отклонений».

Очевидно, это было все же слишком смелое обобщение. Конечно, Кетле открыл, что биологические характеристики, и физические, и психологические, распределяются по нормальной кривой частот, и это было необычайно важное открытие, однако нельзя ни считать его доказательством намерений матери-природы, ни рассматривать отдельные вариации просто как ошибки. Скажем, Кетле обнаружил, что средний рост французских призывников составляет пять футов четыре дюйма. Однако на левом конце кривой он обнаружил человека ростом в один фут пять дюймов. Очевидно, нельзя списывать это на ошибку в четыре фута, допущенную при измерении роста в пять футов четыре дюйма.

Даже если пренебречь идеей «законов», которые определяют создание людей по одному шаблону, уже одно то, что распределение самых разных свойств — от веса до IQ — следует одной и той же нормальной кривой, само по себе примечательно. Но этого мало — даже распределение среднего уровня успешных подач в высшей бейсбольной лиге и то более или менее нормально, равно как и доходность фондовых индексов (которые составляются из множества отдельных фондов). Более того, если распределение отклоняется от нормальной кривой, его, как правило, надо основательно проверить. Например, если распределение оценок по английскому языку в какой-то школе отличается от нормального, это наводит на мысль о проверке принятых там правил выставления оценок. Однако это не означает, что все распределения нормальны. Распределение длин слов, которые Шекспир употреблял в своих пьесах, не нормально. Слов из трех-четырех букв у него гораздо больше, чем слов из одиннадцати-двенадцати букв. Среднегодовой доход на семью в США тоже распределяется не в соответствии с нормальной кривой. Например, в 2006 году самые богатые 6,37 % домохозяйств получали примерно треть всего дохода. Это наталкивает на интересный вопрос: если и физические, и интеллектуальные качества людей (определяющие, надо думать, потенциальные способности получать доход) подчиняются нормальному распределению, почему с доходом все иначе? Ответы на подобные социально-экономические вопросы, к сожалению, выходят за рамки этой книги. С нашей нынешней — несколько ограниченной — точки зрения удивляться следует уже тому, что, похоже, все физически измеримые особенности людей, растений и животных (той или иной разновидности) распределяются по одной-единственной математической функции.







 
kondybas: (Default)

[personal profile] kondybas 2022-07-31 05:42 pm (UTC)(link)
"..Кетле объявил, что представители одного народа стремятся к какому-то среднему показателю.."

Іронія в тому, що усе відбувається строго навпаки - замість руху до модового значення, рівномірний рух до усіх можливих значень.
kondybas: (Default)

[personal profile] kondybas 2022-07-31 06:23 pm (UTC)(link)
Є ще непогана книжка Маріо Льоцці "Історія фізики".

А загалом, неприємність в тому, що на одного, що залишив слід в історії науки, припадає сотня тих, хто перелопатив тисячі тон пустої породи. І про них ніхто нічого не знає. А про декого дізнаються лише випадково, як про того ж Абеля.
kondybas: (Default)

[personal profile] kondybas 2022-07-31 06:41 pm (UTC)(link)
Є люди, котрим хочеться слави, фанфарів, натовпу фанатів і всього такого. Мені досить знати, що рішення є та воно - моє :)

Хоча, брешу. Вже четвертий рік я працюю над монетизацією одного свого рішення - і піду на пенсію.
kondybas: (Default)

[personal profile] kondybas 2022-07-31 06:31 pm (UTC)(link)
"..при цьому ми не знаємо з певністю, що відкинуті нами (як несуттєві) якісь ознаки окремо чи в поєднанні з якимись іншими мають суттєвий вплив на перебіг соціальних процесів.."

Сума великої кількості величин, розподілених рівномірно, є розподіленою нормально, за Гаусом.
Якщо ми бачимо, що якась величина розподілена за Гаусом (як це досліджував Кетле), то це означає лиш одне - що усі значущі фактори цієї величини розподілені рівномірно, і жоден з них не має суттєвого чи вирішального впливу на досліджувану величину.
kondybas: (Default)

[personal profile] kondybas 2022-07-31 07:37 pm (UTC)(link)
Я колись викладав відосика з дошкою Гальтона (на ютубі повно).

Люди - як ті кульки, навіть якщо стартують з однієї позиції, то згодом у кожній точці біфуркації обирають той чи інший шлях доволі рівномірно. Половина йде наліво, половина йде додому :) Поки добіжиш до кінця - а там вже гаусіана.

[personal profile] ichthuss 2022-07-31 09:50 pm (UTC)(link)
Рівномірність тут зовсім байдужа. Майже будь-яка форма розподілу годиться, аби маточікування і дисперсія були скінченними. Ну і, звісно - жодна з величин не повинна давати вирішального впливу.
waqur: (Default)

[personal profile] waqur 2022-07-31 07:05 pm (UTC)(link)
Хм. В этом почти религиозном преклонении перед нормальным распределением есть какой-то социализм. Может, так и было задумано авторами этих старых книг эпохи СССР.

Нет, далеко не все вещи в природе распределены по нормальному закону.

Я давно заметил, что любой ограниченный ресурс (количество денег у людей, распределение криптовалюты по кошелькам, IQ, естественная привлекательность, количество уплаченных налогов и т.д.) имеет экспоненциальное распределение. 20% людей делают 80% работы. 5% запросов к базе данных выполняются 95% времени, и т.д. Назвать эти распределения гауссианой может только слепой: там же нигде нет левой половины, она чаще всего даже не имеет физического смысла, а только максимум в начале и длинный хвост в правой части графика.

Гауссины естественно возникают только в сложных системах, в силу центральной предельной теоремы, где на случайную величину через суммирование влияет много малосвязанных между собой факторов.
kondybas: (Default)

[personal profile] kondybas 2022-07-31 07:33 pm (UTC)(link)
IQ не є обмеженим ресурсом :) Очевидно ж, що величини IQ для кожного індивіда не є залежними одна від одної. Від того, що я тут весь такий умний, ніхто дурнішим не став :)