Лінейная (аг | рэг) рэсія
1.32K subscribers
79 photos
3 files
132 links
Пра даныя і як іх прыстасаваць да штодзённасці

Мяне можна знайсці

У твітары: https://twitter.com/aliaksandr_k
Англ: https://twitter.com/unfriendlydata
На лінкачы: https://www.linkedin.com/in/aliaksandr-kazlou-b5a86411b/
Ці ў тг: @shurackapalieski
Download Telegram
Знайдзі расіста з дапамогай статыстыкі і філасофіі навукі

#statistics

Даследаванне пра расавую дыскрымінацыю ў амерыканскай судовай сістэме. Дадзеныя пра 1116 суддзяў і 380000 прысудаў. Замяраецца тое, колькі год у сярэднім атрымліваюць чорныя, белыя, лацінасы і іншыя. Аналіз кантралюецца на тып злачынства, крымінальную гісторыю падсудных і іншыя фактары, якія могуць уплываць на прысуд.

Праз гэты аналіз знайшлі самых расісцкіх суддзяў - тых, хто выносіць больш жорсткія прысуды чорным ці лацінасам, але не белым. Напрыклад, у цябе было 100 чорных, 40 з іх ты апраўдаў. А са 100 белых, якія ў цябе былі, ты апраўдаў 60. Выбарка вялікая, вынік падазроны, вынік кансістэнтны з дэфініцыяй расізму. А значыць ты расіст. Гучыць лагічна.

Цяпер сачыце за рукамі. Дакладней, рукамі падлічваць мне лянота, таму я проста напісаў сімуляцыю: 1116 суддзяў, у кожнага па 380000/1116 спраў, палова падсудных - чорныя, палова - белыя. Шанец вынесці апраўдальны прысуд заўсёды 50%. Максімальная роўнасць. Таксама прыкруціў ім рандомны генератар імёнаў (інакш неяк непрыгожа).

Атрымаў наступных таварышаў:

Abeyta, Jazmin: 35.3% апраўдальных прысудаў чорным супраць 54% белым
al-Soliman, Mawdood: 38.2% супраць 55.8%
Houge, Charrdonnay: 40.1% супраць 57%

І г.д.

Што гэта значыць? Гэта значыць, што інтэрпрэтацыя дадзеных крытычна залежыць ад гіпотэзы, якую мы правяраем, ад пытання, якое мы задаём.

Калі правяраць гіпотэзу “сярод нас ёсць суддзі-расісты, хто яны?” (“сярод 1116 манет ёсць падкручаная манета, якая з іх?”), натуральна, што Jazmin, Mawdood і Charrdonnay - першыя кандыдаты на тое, каб быць названымі расістамі.

Калі правяраць гіпотэзу “ці ёсць сярод нас суддзі-расісты?” (“ці ёсць сярод 1116 манет падкручаная?”), дадзеныя абсалютна кансістэнтныя з тым, што ў кожнай манеты 50% шанец выпасці на любы бок. Проста калі падкінуць 1116 манет па 340 разоў кожную, рана ці позна мы пабачым анамальныя вынікі.

Паперу яны па выніку перапісалі, адзін з аўтараў нават выдаліў твітэр.
Самы расісцкі суддзя таксама не сышоў непакараны. На ягонай старонцы ў вікі (https://en.wikipedia.org/w/index.php?title=C._Darnell_Jones_II&oldid=1036140457) пэўны час была інфармацыя, што ён - самы расісцкі суддзя ў адпаведнасці з навукай. Прычым, у дачыненні да чорных. Выглядае ён вось так. Памятайце: trust the science!
#everyday #finance

Час ад часу чую, што мае калегі, знаёмыя ці знаёмыя знаёмых займаюцца тым, што называецца active trading ці там day trading - набываюць, прадаюць, сочаць за рынкамі ўсялякай крыпты, акцый, валют і іншага, з надзеяй зарабіць бабло.

Мне, канешне, зрабілася цікавым, наколькі гэта асэнсаваная актыўнасць.

Я знайшоў дзве паперы: адна аналізуе дадзеныя з тайваньскай фондавай біржы за 1992 - 2006. Другая аналізуе дадзеныя з бразільскага “Comissão de Valores Mobiliários” за 2012-2017. Абедзве паперы добрыя тым, што стараюцца паглядзець на індывідуальных трэйдараў на доўгай дыстанцыі, каб зразумець, ці існуюць сістэматычна добрыя стратэгіі, навыкі і г.д.

У першай паперы знайшлі, што менш 1% трэйдараў прадказальна і надзейна зарабляюць на доўгай дыстанцыі. Другая папера знайшла, што толькі 1.1% зарабляе больш, чым мінімальны заробак у Бразіліі. Самы паспяховы трэйдар зарабляў у сярэднім 310$ у дзень, са стандартнай дэвіяцыяй у 2.560$. Ну, тобок - заробак добрага праграміста ў беларускім айці + гіганцкія рызыкі.

Дарэчы, існуе даволі папулярны канал пра фінансы з кантэнтам пра Беларусь і месцамі па-беларуску. Натуральна, не магу не падзяліцца
#science

Псіхалогія - дысцыпліна правальная, у якой большасць (60-80%, у залежнасці ад таго, як лічыць) даследаванняў не праходзяць незалежную праверку. Я прыводзіў некалькі прыкладаў.

Тут зрабілі спіс вядомых і папулярных тэорый, эксперыментаў, даследаванняў, якія не прайшлі незалежную праверку. Ліст вельмі доўгі, я сканцэнтруюся на тым, што яны пазначаюць як “no good evidence” - адсутнасць добрых доказаў:

• “Стэнфардскі (турэмны) эксперымент” і ўсе ягоныя высновы. Калі сказаць адным, што яны цяпер назіральнікі, яны не пачнуць хутка здзекавацца над тымі, каму сказалі быць вязнямі
• “Эксперымент Мілгрэма”. Калі навуковец у белым халаце будзе казаць людзям біць іншых людзей токам, людзі звычайна гэтага не робяць
• Не, ураганы, якія называюцца жаночымі імёнамі, не забіваюць больш людзей, бо людзі менш баяцца жанчын
• Не выглядае, што сіла волі абмежаваная ў тым сэнсе, што і фізіялагічныя магчымасці чалавека - людзі не стамляюцца ад таго, што практыкуюць сілу волі, гэта не рэсурс
• Эфекту Даннінга — Кругера таксама верагодна не існуе. Хвіліна маўчання па тых, хто вакол гэтага мема пабудаваў сабе ідэнтычнасць
• “Множны інтэлект”, як набор статыстычна незалежных "інтэлектаў", напрыклад “эмацыйны інтэлект” vs той інтэлект, які мераецца тэстамі IQ
• Гены якія “адказваюць” за дэпрэсію. Пераправерка 18 даследаванняў з генамі-кандыдатамі паказала 0 станоўчых рэзультатаў
#war #statistics

Часта чую аргумент, што апытанням у расіі наконт вайны давяраць нельга, бо людзі баяцца ўдзельнічаць у гульнях сацыёлагаў.

Аргумент будуецца наступным чынам: пасля пачатку вайны растуць рэпрэсіі -> нават вайну нельга называць вайной -> людзі, якія не падтрымліваюць пуцінскі рэжым, залягаюць на дно = рост падтрымкі пуціна і вайны, які мы бачыў у апытаннях, выкліканы структурным скосам выбаркі - там засталіся толькі ватнікі і пуцінойды

Левада вырашыла праверыць гэта простым спосабам: 1) узялі людзей, якія праходзілі іхнія апытанні ў 2021 2) падзялілі іх на групы ў залежнасці ад таго, падтрымлівалі яны тады пуціна ці не 3) праверылі, ці можна да іх датэлефанавацца ў 2022 і правесці з імі апытанне.

Адказ: Падтрымліваў ты пуціна ў 2021 ці не - верагоднасць прайсці апытанне аднолькавая. Тобок, ніякіх структурных скосаў выбаркі не назіраецца. Тобок, расіяне падтрымліваюць вайну і пуціна.
*Насамрэч, выбаркі там не такія вялікія, хацелася б больш. Але дастатковыя, каб сказаць "гіпотэза пра страх не мае эмпірычнай падтрымкі"
**Пра гэта яшчэ 2 месяцы таму пісаў беларускі сацыёлаг Філіп Біканаў. Пост занадта вялікі, каб прымацаваць скрыншотам, таму прыйдзецца вам ісці на фб і чытаць
#machinelearning #visualization

Падзялюся з вамі візуалізацыяй таго, як працуе машыннае навучанне ака Machine Learning. Перыядычна ёй з усімі дзялюся, бо надта добра зроблена і зроблена для людзей, а не тэхнічных спецыялістаў. Па-беларуску, увы, няма, але ёсць на іншых мовах.

http://www.r2d3.us/visual-intro-to-machine-learning-part-1/
#statistics

Даўно хацеў напісаць які-небудзь занудны пост пра статыстыку. Ваш час пакутаваць надышоў.

Мы часта чуем фразы а-ля “навукоўцы даказалі”, ці “статыстычна значны”. Дык а як навукоўцы нешта “даказваюць”? Што гэта ўвогуле значыць? Зараз я паспрабую ў 3 абзацах максімальна проста патлумачыць вам 95% сучаснай статыстыкі.

Бяром 2 групы па 100 чалавек, у якіх баліць галава. Адным даем аспірын, другім не даем. Праз гадзіну запытваем “ну шо ты”. У першай групе галава перастала балець у 30 чалавек, у другой - 15. Адкуль мы ведаем, што аспірын працуе?

Усё насамрэч проста. Кажам: “давайце ЎЯВІМ, што аспірын НЕ працуе”. Значыцца розніца, якую мы бачым (30 супраць 15 чалавек) - гэта чыста памылка выбаркі. Ну, набралі мы так людзей, што ў эксперыментальнай групе ў большай колькасці галава б і так прайшла, без усялякіх аспірынаў.

Далей мы задаём цэнтральнае пытанне 95% усіх сучасных навуковых даследаванняў, якія выкарыстоўваюць статыстыку: калі розніца няма, як часта мы б пабачылі такую (30 супраць 15) ці большую розніцу праз памылку выбаркі. Калі адказ “менш чым у 5% выпадкаў”, тады мы называем гэты вынік “статыстычна значным” і бяжым да журналістаў казаць, што аспірын дапамагае ад галавы. Усё.

Падрабязней можаце пачытаць тут
#everyday

Нядаўна пачуў спрэчку пра тое, як правільна займацца ў трэнажорцы. Першы раз са школы мабыць. Ну, колькі падыходаў, колькі паўтораў, як часта і г.д. Мы зараз пра рост мышцаў, канешне. Адказ тут ёсць і даўно вядомы. Зараз распавяду.

Гісторыя ў гэтага пытання прыкольная. Напрыклад, быў такі Арнольд Шварцэнэгер. Ён займаўся вельмі шмат, часам - па 32 падыходы на групу мышцаў у тыдзень. Як выглядае Шварцэнэгер усе ведаюць. У яго быў канкурэнт - Майк Мэнцэр. Майк рабіў, у экстрыме, 1-2 падыходы на групу ў тыдзень і ўсё. Майк выглядаў вось так. Адсюль пытанне, якое нарадзіла мільёны гадзін спрэчак: калі няма розніцы, навошта займацца больш?

Ясна, што яны - прафесійных атлеты, а мы з вамі - прафесійныя катлеты, у лепшым выпадку. Але для нас тут таксама ёсць карысная інфармацыя.

Існуе тысячы, літаральна, даследаванняў пра тое, як правільна хадзіць у трэнажорку. Я буду спасылацца на адну добра напісаную паперу, якая ўключае іншыя агляды літаратуры, дадзеныя мета-аналізаў і дадзеныя канкрэтных эксперыментаў.

Няма ніякай розніцы, колькі і чаго вы робіце, калі вы робіце 2-20 падыходаў на групу мышцаў у тыдзень з інтэнсіўнасцю прыкладна ў 30-80% ад вашага максімума на адзін раз у канкрэтным практыкаванні і ў дыяпазоне 2-35 паўтораў. Ніякай розніцы. Адзінае, што гуляе ролю - аб’ём нагрузкі за тыдзень. А як вы яе размяркуеце ролі не гуляе.

Парачка прыкладаў. Адна група рабіла 7 падыходаў на 2-4 паўторы, другая - 3 падыходы на 8-12 паўтораў. Пасля 8 тыдняў ніякай розніцы ў росце мышцаў. У другім эксперыменце ўсе рабілі па 3 падыходы, але адна група - у дыяпазоне 25-35 паўтораў, другая - у дыяпазоне 8-12 паўтораў. Пасля 8 тыдняў ніякай розніцы ў росце мышцаў. Наступны эксперымент: адна група займалася 4 разы ў тыдзень, другая - 2 разы, але з аднолькавай колькасцю падыходаў. Пасля 6 тыдняў адгадайце што? Правільна - ніякай розніцы ў росце мышцаў. І г.д. і г.д.

Адзінае, на што варта арыентавацца, гэта вашыя асабістыя пажаданні. Бегаць 6 разоў на тыдзень у трэнажорку ў большасці з нас часу няма. Для таго, каб займацца з максімальнай інтэнсіўнасцю і вам хапала 1-2 падыходаў на тыдзень, у нас з вамі няма тэхнікі і матывацыі. Ну гэта і проста рызыкоўна - занадта высокі шанец траўмы.

Для большасці з нас аптымальны наступны пратакол: 5-10 падыходаў на групу мышцаў у тыдзень, у дыяпазоне 5-25 паўтораў, каб хаця б адзін падыход у тыдзень быў “да адмовы” - каб яшчэ адзін паўтор вы фізічна зрабіць не маглі.
#statistics #belarus

Часам можна пабачыць, як людзі заломваюць рукі і пытаюцца, чаму Беларусь не дэмакратыя. Пытанне валіднае і для грамадскай дыскусіі карыснае. Але ёсць нюанс. Мне падаецца, што ў гістарычнай перспектыве яно не вельмі цікавае. Прынамсі пакуль. Бо нічога незвычайнага ў беларускім аўтарытарызме няма.

Часам, калі аналізуюць дэмакратызацыі, у якасці адной з пераменных выкарыстоўваюць дыстанцыю, у кіламетрах, да Бруселя. Як тут. Які ў гэтым сэнс? Ідэя ў тым, што недзе ў тых землях, ці адносна побач, з людзьмі нешта не так. То пратэстантызм сабе прыдумаюць, то дэмакратыю, то яшчэ чаго для праваслаўнага чалавека шкоднага.

Ну а далей зусім проста: ідэі, як вірус, пераносяцца людзьмі, ну і раз суседзі камунікуюць больш, ідэі паміж імі перацякаюць хутчэй. У гэтым сэнсе проста кіламетры да Бруселя - метрыка ідыёцкая, размова пра шчыльнасць кантактаў, гандлю і г.д. Затое яе проста падлічыць.

Увогуле, калі паглядзець на мапу Freedom House, на нашым кантыненце не так шмат анамалій: дэмакратычная Манголія, дэмакратычная Індыя ну і яшчэ парачку. У астатнім - дэмакратыя, як пляма, размазана кіламетрамі ад Бруселя. Але гэта візуальна, то мне захацелася падлічыць усё больш фармальна.

Ну я і падлічыў. Карэляцыя паміж тым, колькі краіна год бесперапынна дэмакратыя і кіламетрамі для Бруселя негатыўная, -0.6. Тобок, чым далей ад брусэляў, тым менш год вашым дэмакратыям.

Карэляцыя -0.6 гэта многа ці мала? Для параўнання:
- карэляцыя паміж інфляцыяй і ростам ВУП з 1960 па 2020 на планеце была -0.064
- карэляцыя паміж памерам ВУП на душу і працягласцю жыцця за той ж перыяд была 0.549

Кажучы проста, тупыя кіламетры для Бруселя - больш моцны прэдыктар дэмакратызацыі, чым ВУП на душу насельніцтва - прэдыктар працягласці жыцця і нашмат больш моцны, чым інфляцыі ёсць прэдыктарам эканамічнага росту.

Прынамсі, гэта для краін "Europe & Central Asia" у класіфікацыі сусветнага банку. Для ўсёй планеты гэта працаваць не будзе, таму што дыстанцыя да Новай Зеландыі ў кіламетрах надта вялікая. А дадзеных пра шчыльнасць кантактаў, гандлю і г.д. у мяне няма.

Пры гэтым, калі вы распавядзе пра гэты факт “палітолагам”, вы адразу пачуеце мільён заўваг: “Вільня ж не далей ад Бруселя, чым Менск!”, “а Талін далей, ха!” і г.д. Усё гэта таму, што ў “палітолагаў”, як правіла, няма колькаснай інтуіцыі наконт таго, колькі контрпрыкладаў можа існаваць на залежнасці рознай сілы.
#statistics

Хачу дапамагчы вам разабрацца з адной памылкай, якую часта робяць, калі глядзяць у выніку апытанняў.

Уявім сабе, што спрыяльна да расіі ў сакавіку 2022 ставілася 43% беларусаў, а ў чэрвені 2022 - 40% беларусаў. Я часта бачу наступную выснову: “ну, гэта не статыстычна значны вынік” / “нуу, там памылка рэпрэзентатыўнасці 2%” / і г.д., а значыцца нічога насамрэч не памянялася.

Вось гэтая выснова “нічога насамрэч не памянялася” - памылка. Выснову, якую мы павінны зрабіць (гіпотэза, якая найбольш верагодная) - гэта тое, што падтрымка рф упала на 3 працэнты. Прычым гэта будзе справядліва і для выбаркі ў 10, у 1.000, у 100.000 чалавек. Усё, што будзе адрознівацца - нашая ступень упэўненасці ў гэтым. Але НЕ, гэта не значыць, што калі вынікі "не статыстычна значныя", гэта робіць гіпотэзу пра адсутнасць зменаў найбольш верагоднай. Не, не робіць,

1) З выбаркай у 10 чалавек, мы б сказалі “гіпотэза пра падзенне ў 3% найбольш верагодная, але давер у нас вельмі нізкі”
2) З выбаркай у 1000 чалавек, мы б сказалі “гіпотэза пра падзенне ў 3% найбольш верагодная, але давер у нас сярэдні”
3) З выбаркай у мільён чалавек, мы б сказалі “гіпотэза пра падзенне ў 3% найбольш верагодная, мамай клянуся”

Адзіна што, вы можаце быць моцна ўпэўненыя, што лічба не змянілася. Тады вы кажаце: “дадзеныя настолькі слабыя, а маё меркаванне - настолькі моцнае, што я гатовы змяніць яго з 0% да 0.3%, максімум. Але ніяк не да 3%”. Гэта абсалютна нармальна, завецца “баесаўская статыстыка”, але рабіць гэта трэба экспліцытна і шчыра. Асабліва карысна самому сабе прызнавацца ў сваіх моцных меркаваннях.

Пры гэтым, агульны скептыцызм я падзяляю і паважаю. Чым больш вы скептычныя да дадзеных, тым лепш. А я бачу ўсё больш і больш крытычных пытанняў такога кшталту ад беларусаў. Вы малайцы.
Знаёмы хацеў даведацца, ці вядзе два тг-каналы адзін і той ж чалавек. Ну мы з @mickolka і напісалі пад гэта старонку. Ідэя даволі простая: тое, колькі ў вас словаў у сярэднем на сказ, колькі вы косак ставіце, як актыўна ўжываеце “:” ці “–” ёсць нейкімі маркерамі вашага стылю, даволі ўстойлівымі.

Большасць метрык там "p/s" - per sentence, тобок "на сказ". 95% давяральныя інтэрвалы мы туды таксама прыкруцілі, каб у людзей было ўяўленне, наколькі гэтыя стытыстыкі шумныя.

Мабыць каму з вас спатрэбіцца: https://share.streamlit.io/mickolka/texts_comparison/streamlit-integration/streamlit_main.py
#science

Выглядае, што ўбер плаціў эканамістам у Францыі і Германіі, каб яны пісалі для іх акадэмічныя паперы, у якіх падкрэслівалі перавагі ўбера: маўляў, працоўныя месцы стварае, транспартную сістэму паляпшае і г.д. Бо іхнія ўрады актыўна ставілі ўберу палкі ў колы рэгуляцыямі.

Наколькі гэта праўда ці не мне зрабіць выснову складана. Але нічога дзіўнага ў гэтым няма - фармакалагічныя кампаніі займаюцца подкупам акадэмікаў 24/7. І шмат яшчэ хто.

Год 5-7 таму часта бачыў спрэчкі пра ўбер, дзе там сям прыводзілі спасылкі на падобныя артыкулы з аргументацыяй “навука даказала”. Ахах, тобок ой.
#belarus #statistics

Ніколі такога не было і вось ізноў: Чалы спрабуе даказаць беларусам, што не трэба слухаць Шрайбмана (спасылка на Курэйчыка рандомная, мне лянота арыгіналы шукаць). Не ведаю, якое ў вас стаўленне да гэтага пласту беларускай культуры. Я стараюся ігнараваць, але часам як у тым меме з чалавекам-павуком.

Але распавесці хачу не пра гэта. Яны там закранаюць даследаванне Chatham House пра тое, як мы ставімся да геяў, чорных, арабаў і г.д. У Гены Коршунава ёсць добры агляд, каму цікава.

Калі коратка, задаюць пытанне “Я лично готов(а) принять представителя данной группы …" і даюць адказы: Как близкого родственника, Как близкого друга, Как соседа по дому, Как коллегу по работе, Как гражданина моей страны, Как гостя (туриста) в моей стране, Ни в каком виде. Далей прыпісваюць балы ад 1 да 7 і мераюць дыстанцыю. Усё даволі проста.

А я вырашыў разабрацца, якімі характарыстыкі беларусаў можна прадказаць. І прыйшоў да высновы, што прадказаць беларусаў…немагчыма.

Усяго задаюць пытанні пра 14 груп. Я пабудаваў лінейныя мадэлі (што крыху бязбожна, затое хутка) для ўсіх 14. Ну і набраў тыповых падазроных: пол, узрост, памер населенага пункту, матэрыяльнае становішча, узровень адукацыі. Дык вось. Мае мадэлі на каленцы тлумачаць 0 - 9% варыяцыі ў адказах. Тобок нічога не тлумачаць.

Лепш за ўсё тлумачыцца стаўленне да геяў, 9%. Ну і гісторыя там прадказальная: чым вы маладзейшы, больш адукаваны, у лепшым матэрыяльным стане, тым больш вы талерантны. Яшчэ дапамагае, калі вы жанчына. Усё гэта карэлюе з адказамі, проста слаба.

Агулам беларусы непрадказальныя, няўлоўныя, містычныя. Як смуга над полем, як багна, як чарговая тэма для срачаў у твітэры.
Добрай раніцы. Да ўчорашняга паста.

Разумныя людзі мне кажуць, што нізкая сувязь паміж такімі пытаннямі і сацыяльна-дэмаграфічнымі характарыстыкі - рэч не ўнікальная для беларусаў. Італьянцаў там якіх ці грэкаў таксама складана прадказаць. Так крыўдна за ўнікальнасць беларусаў зрабілася, быццам у душу наплявалі.

Таму я вырашыў паглядзець, што ж у дадзеных Рыгора Астапені больш за ўсё карэлюе з дыстанцыяй да розных сацыяльных груп. Ну і пачаў з геяў.

Па-першае, адказы на іншыя пытанні карэлююць. Ну, калі вам не хочацца ціснуць руку яўрэям ці чорным, геям вы таксама наўрад ці пяцюні раздаяце. Гэта нецікавая частка.

Цікавая частка ў тым, што найбольш негатыўна (-0.28) з дыстанцыяй да геяў карэлюе адказ на пытанне "Я убежден, что протестное движение было вызвано извне недружественными действиями иностранных государств". А найбольш пазітыўна (0.304) з адказамі на пытанне "Как вы относитесь к акциям протеста против действующей власти?"

Тобок, геяў не любяць у нас тыя, для каго пратэсты былі аркестраванымі замежнымі лялькаводамі і тыя, каму яны агулам не падабаліся. І гэта нашмат больш істотны фактар, чым пол, узрост, заробак ці адукацыя. Ці астатнія 270 пытанняў, якія я праверыў. Аналагічна і па іншых сацыяльных групах.

Такія справы.
#statistics

Атрымаў мілых каментароў пад гэты пост і вырашыў перыядычна дапамагаць вам з розным там статыстычным жаргонам.

Сёння паразмаўляем пра “давяральныя інтэрвалы”. Упэўнены, што бачылі вы іх часта. Уявім, што Андрэй Вардамаці аналізаваў сацыялогію згушчонкі. І 50% беларусаў выбралі рагачоўскую. І ў дужках вы бачыце стандартны тэкст (як тут): “памылка выбаркі пры 95% давяральным інтэрвале не перавышае 3%”.

Окей, але што гэта значыць? Куды яно чаго не перавышае? Інтуітыўна зразумела, што 3% - лепш, чым 30%, а яшчэ б лепш 0.03%. Інтуітыўна вы абсалютна правыя. Я прыкладна гэтак імі і карыстаюся. Цікавасці пачынаюцца тады, калі задаваць больш канкрэтныя пытанні.

Уявім сабе, што сацыёлаг Алег Манаеў вырашае правесці аналагічнае апытанне. Выбарка такога ж памеру, пытанне такое ж, усё такое ж. Які шанец, што % за рагачоўскую згушчонку на новай выбарцы трапіць у 47-53%, як у Вардмацкага? Нагадваю, інтэрвал у нас 95%. Адказ 0.95, канешне, няправільны. Правільны адказ - 0.83. А калі сюды падключыцца Філіп Біканаў і правядзе трэцяе апытанне, верагоднасць, што і ягоныя вынікі, і вынікі Манаева трапяць у давяральныя інтэрвалы, разлічаныя Вардмацкім, будзе 0.72. Ну і г.д.

“Што за хрэнь?” - гэта пытанне, якое я задаю сабе кожны дзень на працы. Справа ў любові класічнай статыстыкі да зянонаўскай Беларусі ідэальных сутнасцяў, бясконсасцяў і іншых тэарэтычных канструктаў. А выбаркі ў нас жывыя, выбаркі ў нас шумныя. І шум кожнай індывідуальнай выбаркі накладаецца. Фармальна гэта тлумачыцца праз адатыўнасць варыяцыі, але я не прыдумаў, як вам проста гэта патлумачыць.

Калі гэтае пытанне задалі 263 псіхолагам, медыкам і спецыялістам па нейранавуках, большасць з іх таксама адказала няправільна. Чаму? Разгадка простая - мы эвалюцыянавалі каб бегаць ад драпежнікаў, бегаць за ежай і каб прыгожая малпа з суседняй пальмы нас заўважыла. І не для разважанняў пра верагоднасці. Таму, калі доўга паўтараць “95% давяральны інтэрвал”, людзям пачынае падавацца, што адказ заўсёды “95%”. Малпачка бачыць - малпачка паўтарае.
Добрай раніцы. Забыў ва учорашнім пасце пра самае сакавітае.

Дык, гэта, калі мы атрымалі 50% за рагачоўскую, памылка выбаркі ў нас не перавышае +/- 3% пад 95% давяральнымі інтэрваламі, які шанец ш​​то рэальны % за рагачоўскую ў папуляцыі - паміж 47% і 53%? Як вы маглі здагадацца, адказ 0.95 зноў няправільны.

Правільны адказ: альбо 1, альбо 0 - альбо рэальны % у гэты інтэрвал трапляе, альбо не. І гэта, як не дзіва, не пустая філасофія.

Сачыце за рукамі. Уявім сабе, што вы гуляеце ў гульню. Вам даюць 2 капэрты на выбар.У адной з іх у 2 разы больш грошаў, чым у іншай. Вы выбіраеце. Пасля гэтага вам прапануюць капэрту памяняць . Ці трэба вам мяняцца?

Разважаем наступным чынам: У нашай капэрце Х грошаў. Значыцца з верагоднасцю 1/2 у іншай капэрце альбо 2Х, альбо X/2. Тады матэматычнае чаканне сумы ў іншай капэрце ў нас 1/2*2X + 1/2*X/2 = 5/4*X. А гэта больш, чым X. Значыцца трэба мяняць капэрту. Але! Калі вы яе памяняеце і вам прапануюць зноў яе памяняць, вам зноў больш рацыянальна пагадзіцца - разлік ж той жа самы.

Ага ага. Памылка тут у інтэрпрэтацыі верагоднасці. Як і ў пытанні “якая верагоднасць, што рэальны % за рагачоўскую ў давяральным інтэрвале”. Калі вам даюць капэрты, выбар наконт таго, колькі грошаў у якую пакласці ўжо зроблены. І ніякай “верагоднасці” там ужо няма. І калі вы бачыце давяральны інтэрвал сваёй выбаркі, ніякай верагоднасці там таксама няма - у вас і інтэрвал фіксаваны, і рэальны % за рагачоўскую ў папуляцыі фіксаваны. Вы проста не ведаеце, як.

А тут ужо можна ўпадаць у філасофію. Гэта ўсё справядліва толькі для таго варыянта “верагоднасці”, у межах якога, канцэптуальна, давяральныя інтэрвалы канструююцца. Класічны альбо частотны варыянт. Але гэта не адзіная канцэптуалізацыя верагоднасці. Ну і пайшло паехала.
#covid

Кавідны пост

Пачуў на днях пра артыкул, пра які вы таксама хутка пачуеце, калі яшчэ не - пра тое, што пабочных эфектаў ад mRNA вакцын больш, чым карысці. Крытыка таксама ўжо даступная. Ну і вырашыў напісаць свой першы і спадзяюся апошні пост пра кавід.

Справа ў тым, што я нічога не ведаю пра кавід. І гэтаму ёсць некалькі прычын.

Па-першае, мне проста не цікава. На пачатку эпідэміі ў мяне яшчэ былі спадзяванні на зомбі-апакаліпсіс, але ўся гэтая гісторыя надакучыла мне даволі хутка.

Па-другое, веды статыстыкі, якія патрабуюцца для аналізу такіх дадзеных, у мяне адсутнічаюць. Дакладней, ніякіх асаблівых ведаў там не патрэбна, але ў мяне адсутнічае інтуіцыя пра нюансы працы з імі. Адносныя рызыкі, абсалютныя рызыкі, OR, RR, крывыя выжывання, кантрольныя кропкі, чаго ўвогуле, куды, за шо.

Па-трэцяе, на адных ведах статыстыкі далёка не ўедзеш. Для таго, каб ацаніць дызайн у такіх рэчах, трэба шмат прадметных ведаў: як так арганізаваць плацэба для прыскалкі ў нос, у якой ёсць спірт, каб кантрольная нічога не зразумела; хто там праводзіць даследаванне - персанал, які пастаянна кантактуе з кавіднікамі ці нейкія стэрыльныя таварышы; адкуль там антыцелы браць, праз які перыяд і мільёны падобных нюансаў. Калі казаць выключна пра статыстыку, ёсць жарт, што людзі, якія бачылі, як медыкі аналізуюць свае дадзеныя, пачынаюць паважаць эканамістаў. Што таксама не дадае матывацыі ў гэтым разбірацца.

Гляджу таму я на гэта ўсё гэта даволі прагматычна:

1. Кумулятыўных доказаў таго, што вакцыны працуюць (у шырокім сэнсе), настолькі шмат, што мне лянота сумнявацца. Калі нехта знойдзе канкрэтны прабел, я пра гэта абавязкова пачую, мы ўсе пачуем.

2. Калі мне задаюць пытанне, наколькі верагодныя фальсіфікацыі ў дадзеных пра кавід, я адказваю, што верагоднасць там 100%. Ну, ціпа - фармакалогія ёсць самай карумпіраванай дысцыплінай, у якой выкарыстоўваецца статыстыка. Але чаму толькі кавідныя вакцыны? Гэта ж для ўсяго справядліва, было і будзе. Пераставаць хадзіць да доктараў я праз гэта не збіраюся.

Асноўная праблема каляпалітычных антываксерскіх дэбатаў пра кавід у тым, што людзі бачаць нейкую супярэчнасць паміж гэтымі фактамі. Я не бачу.
#everyday

На працы паказалі графік з верагоднасцю трапіць у шпіталь з пераломам у залежнасці ад узросту. Даволі цікавае.

Па-першае, на графіку добра бачны пубертат: да 15 год хлопчыкі і дзяўчынкі ламаюцца прыкладна аднолькава, пасля 15 дзяўчынкі рэзка перастаюць, хлопчыкі - паскараюцца ўдарнымі тэмпамі. Яно і зразумела: спрадвечная эвалюцыйная стратэгія “прыгні з маста, каб спадабацца дзяўчыне, з якой ты нават не размаўляў” сама сябе не рэалізуе.

Далей таксама цікавае. Самы надзейны ўзрост для мужчын - гэта 60 год. Літаральна перасячэнне, калі яшчэ ёсць нейкі тэстастэрон і здольнасць утрымліваць мышачную масу, але схільнасці да ідыятызму куды менш, чым у 17.

P.S.: Калі вам 60 год і вы яшчэ прыгаіце з мастоў, каб спадабацца жанчынам - заўвагу пра ідыятызм можаце ігнараваць. Бясконца паважаю і не адгаворваў б.
#statistics #science

Мне па працы часта прыходзіцца чытаць артыкулы пра пра менструальныя цыклы, цяжарнасці ці авуляцыі. Часам натыкаюся на вясёлы трэш. Зараз пра адзін распавяду.

Аўтары паперы знайшлі, што ў 2012 у ЗША замужнія жанчыны ў авуляцыю часцей выбіралі Ромні, а незамужнія ў авуляцыю - Абаму. Тлумачылі яны гэта прыкладна так: для незамужніх у авуляцыю важна перадаць свае гены, таму яны выбіраюць больш сіметрычнага Абаму (больш сіметрыі - лепшыя гены). А замужнія абіраюць кансерватара Ромні, бо гэта ў іх ад шлюбу развіўся механізм, які ў авуляцыю робіць іх больш кансерватыўнымі і такім чынам спрыяе захаванню шлюба.

Душэўна. Давайце ўявім, што аўтары б атрымалі вынікі наадварот - незамужнія ў авуляцыю галасуюць за кансерватараў, замужнія ў авуляцыю - за лібералаў. Прыдумаць такой якасці “тлумачэнне” - 2 хвіліны: “незамужнія выбіраюць у авуляцыю кансерватараў, бо шукаюць больш маскулінных партнёраў, а замужнія галасуюць за лібералаў, бо цяжар сямейнага быту робіць усялякія ліберальныя каштоўнасці, у тым ліку - вольныя сексуальныя паводзіны, больш прывабнымі”. Ну ці прыдумайце свой варыянт. Прыдумляць іх можна хоць да ночы.

Я гэта да чаго. Ёсць шмат прычын лічыць, што гэтае даследаванне - шум. Калі паварочаць любы шум - па рознаму вызначаць фертыльнае акно, паглядзець не на шлюбы, а на заробак, ці лакацыю і г.д. - шум пачне складацца ў патэрны. Якія патэрны мы б там не пабачылі, мы б заўсёды здолелі прыдумаць ім тлумачэнне.