Лінейная (аг | рэг) рэсія
1.34K subscribers
83 photos
3 files
138 links
Пра даныя і як іх прыстасаваць да штодзённасці

Мяне можна знайсці

У твітары: https://twitter.com/aliaksandr_k
Англ: https://twitter.com/unfriendlydata
На лінкачы: https://www.linkedin.com/in/aliaksandr-kazlou-b5a86411b/
Ці ў тг: @shurackapalieski
Download Telegram
Пра правалы, статыстыку, машнные навучанне, індустрыю і акадэмію. Частка 1

Выпадковы выдаліў, перазаліваю

#statistics #machinelearning

Правалы - гэта неад'емная, мабыць ключавая частка развіцця навукі, ды і ўвогуле развіцця. Вакол гэтай ідэі існуе шмат добрых канцэптаў, напрыклад - failure CV. Але я хачу распавесці не проста пра няўдачы, а пра канкрэтны трэш ва ўжыванні статыстыкі і пабудове статыстычных мадэляў: у акадэміі, а таксама ў індустрыі.

З акадэміяй у гэтым плане вельмі проста, бо ўсё задакументавана. З індустрыяй нашмат больш складана, бо бізнэс-спецыфіка, NDA, а таксама жаданне абмежаваць рэпутацыйныя выдаткі. Таму пачнем з індустрыі. Частка гэтых гісторый - хутчэй за ўсё байкі. Частка - абсалютна рэальныя і я нават ведаю ўдзельнікаў. Істотна, аднак, што кожная з іх магла здарыцца з аднолькавай верагоднасцю і магчыма здаралася неаднойчы.

З улікам таго, што пра “AI failures” пішуць шмат, а ад гісторый кшталту “напужаны Цукенберг закрыў АІ праэкт, таму што нейронкі стварылі сваю сакрэтную мову” у мяне пачынае балець галава, распавядаць я буду пра банальныя, чалавечыя, прыземленыя індустрыйныя правалы.

Большасць фэйлаў ў машынным навучанні добра апісваецца анекдотам пра “хачу сабе танк на ўсю спіну – гатова – а чаму так хутка? – а хулі там чатыры літары”. Таму першая байка – пра савецкія/расійскія і амерыканскія танкі. Алгарытм павінен быў навучыцца іх адрозніваць. Працаваў добра, але ўпарта класіфікаваў новыя расійскія мадэлі як амерыканскія. Разбор паказаў, што фота савецкіх танкаў былі горшай якасці, што алгарытм паспяхова і вывучыў. Альтэрнатыўная версія гэтай байкі: алгарытм вучылі адрозніваць танкі, замаскіраваныя ў лесе, ад проста фота лясных масіваў, але два тыпы фота былі зробленыя ў розныя дні, таму алгарытм вырашыў, што прасцей замест танкаў адрозніваць воблачнасць.

Наступная байка - пра алгарытм, які павінен адрозніваць хаскі ад ваўкоў. Спрабуючы ўявіць сабе практычны сэнс такога алгарытму, я прыйшоў да высновы, што мець магчымасць адрозніць хаскі ад воўка смартфонам, у лесе, ноччу, калі нешта рыкае ў метры ад цябе ў цемры – гэта сапраўды карысна і шматабяцальна. Гісторыя ў тым, што алгарытм паказаў сябе вельмі добра, апроч рэдкіх кейсаў, дзе расава чыстыя хаскі ўпарта класіфікаваліся як ваўкі. На ўсіх гэтых анамальных фота хаскі былі на снезе. І ўсе ваўкі ў датасэце былі на снезе. Дэталёвы разбор паказаў, што алгартым наўпрост навучыўся адрозніваць белы фон на фота.

Зараз шырокую папулярнасць набываюць разнастайныя мабільныя дадаткі на мяжы “медыцыны і AI”. Адна апка абяцала адрозніваць здаровую і хворую скуру па фота з камеры. Але пры першых real life выпрабаваннях алгарытм праваліўся. Як высветлілася, якасць класіфікатара ў істотнай прапорцыі базавалася на здольнасці вызначыць на фота лінейку. Каб зразумець чаму, можна паглядзець на фота па запыце "identifying red spots".

Яшчэ адна гісторыя – пра амбіцыёзны стартап аўтаматычнай дапамогі ў прыняцці медыцынскіх рашэнняў. У людзей ёсць магчымасць насмяяцца з абсурдных карэляцый. У няшчасных робатаў – не. Таму, апасля серыі плоскіх калькуляцый, алгарытм параіў медыкам перастаць адпраўляць людзей на хіміятэрапію, бо пацыенты апасля яе часцяком паміралі. Усё па першым законе робататэхнікі Азімава.

Мая ўлюбленая гісторыя - пра каманду пачынаючых дата сайнцістаў, якія распрацавалі алгарытм прадказання адтоку кліентаў у наступным месяцы. Алгарытм меў “99% дакладнасці”, а прэзентацыя ўтрымлівала невыносную колькасць словаў Artificial і Intelligence. Старыя каманды CRM і аналітыкаў моцна напружыліся і іх можна зразумець – робаты забіраюць працу, “скураныя мяшкі не патрэбныя”, вось гэта ўсё. Як апынулася, найбольш моцнай фічой для прадказання ў новым алгарытме была “колькасць дзён без аплаты”. Сам факт адтоку кліента па бізнэс-правілах, якія пачынаючых будавацеляў робатаў цікавілі мала, вызначаўся як “90 дзён без аплаты”. Тобок, 90 дзён без аплаты ідэальна прадказвала 90 дзён без аплаты. Як і менш 59 дзён без аплаты ідэальна прадказвала адсутнасць адтоку, бо алгарытм прадказваў на месяц наперад. Ваісціну, неабмежаваныя магчымасці.
Пра правалы, статыстыку, машнные навучанне, індустрыю і акадэмію. Частка 2

Першая частка
- https://t.me/linearaggression/9

#statistics #science

Абяцаў працягнуць першую частку, але не пра індустрыю, а акадэмію. Пачнем з даследвання пра power poses. Сутнасць ідэі ў тым, што прыняццё т.з. power poses - рукі ў бокі, шырока пастаўленыя ногі, картаны на дзевяноста градусаў - змяняе гарманальны фон і робіць людзей больш упэўненымі.

Даследванне настолькі папулярнае, што пад адпаведным TED talk на ютубе 16 міліёнаў праглядаў, а брытанскія Торы адаптавалі гэтую стратэгію для сваіх публічных выступаў. Апошняе, дарэчы, выглядае абсалютна прэкрасна. Таксама, у галоўнай аўтаркі, Amy Cuddy, атрымалася напісаць на падставе даследвання папулярную кнігу, амазонаўскі рэйтынг якой на дадзены момант складае 4.4 з 5, а кніга мае 527 водгукаў.

Праблема ў тым, што эксперымент праводзіўся на 42 чалавеках. Не на 4200 і нават не на 420 - на 42 чалавеках. Калі гэта выглядае абсурдным, я спяшаюся вас папярэдзіць - значная частка даследванняў па псіхалогіі мае нават меншыя выбаркі.

Не дзіва, што калі іншая каманда паспрабавала паўтарыць даследванне, але на большай выбарцы, у іх нічога не атрымалася. Падрабязны статыстычна агляд арыгінальнага даследвання і рэплікацыі можна прачытаць тут.

Нашмат далей пайшоў дактарант паліталогіі з UCLA, Michael LaCour. Ён апублікаваў даследванне, як кароткая размова з геямі перманента змяншае гамафобію. Паспяхова атрымаў сваё PhD, здолеў апублікаваць даследванне ў Science і нават атрымаў пазіцыю ў Прынстане.

Іншым дактарантам было зайздрасна і яны вырашылі паўтарыць поспех. Шэраг далейшых разбораў паказаў, што даследванне не проста памылковае - яго не было. Тобок, LaCour прыдумаў грант, прыдумаў даследванне, прыдумаў людзей, якія яго праводзілі, стварыў фэйкавыя дадзеныя, гадамі пра гэта хлусіў і здолеў апублікавацца ў Science - топавым навуковым часопісе.

Як потым апынулася, большую частку свайго CV ён таксама выдумаў - гранты, даследванні, выдуманыя ўзнагароды і перамогі ў конкурсах. Наколькі я памятаю, народ дакапаўся да фальсіфікацый нават у ягонай бакалаўрскай. Ці дайшоў крыжовы паход да фактаў фальсіфікацыі аплікацыі ў дзіцячы садок мне не вядома.

Апасля гэтага LaСour знік, але ўсплыў праз год як “data scientist / visualization specialist" са сваім сайтам і брэндам. Увы, мае букмаркі на ягоныя працы даўно бітыя, але я памятаю, што візуалізацыі там былі проста топавыя. З іншага боку, правярнуць такую аферу неверагодна складана, а значыць чалавек далёка не бесталентны. Не здзіўлюся, калі ён скончыць якім-небудзь лабістам у Вашынгтоне - моцны талент і нямоцныя маральныя абмежаванні з’яўляюцца каштоўным рэсурам.

Але прыкладам сапраўднага правалу я лічу вядомы сярод эканамістаў log(NAICS) артыкул. Аўтар будаваў фінансавую мадэль і ўключыў лагарыфм ад NAICS у якасці адной са сваім пераменных. Справа ў тым, што NAICS, альбо North American Industry Classification System, з’ўляецца намінальным індэксам, у якога няма ніякай кардынальнасці і адносінаў парадку. Тобок, індэкс 111211 (вырошчванне бульбы) не з’яўляецца на 100095 пунктаў большым за індэкс 11116 (вырошчванне рысу). У гэтых “пунктаў” увогуле няма фізічнага сэнсу.

Больш за ўсё дастаўляе, што аўтар ўзяў ад яго лагарыфм, што з’яўляецца стандартнай працэдурай падгону размеркаванняў у лінейных мадэлях. Тобок, чалавек над ім разважаў.

Магчыма, мала хто б звярнуў на гэтую паперу ўвагу, калі б не той факт, што за яе аўтар атрымаў Edwin Elton Prize for Bes Job-Market Paper in Finance, а таксама падтрымку свайго навуковага кіраўніка, па сумяшчальніцтве - Нобелеўскага лаўрэата. Зараз аўтар - Assistant Professor у Гарвардзе. Such academia much meritocracy wow.
Па-моднаму ці па-багатаму: дэманстратыўнае спажыванне, айфоны, крэдыты і эканамічная тэорыя (контр)сігналінгу

#statistics #everyday

Насамрэч, мы не ведаем, наколькі актыўна, ці актыўна адносна іншых краін беларусы набываюць айфоны ў крэдыт. Як і не ведаем, наколькі распаўсюджаныя іншыя формы дэманстратыўнага спажывання. Будзем сыходзіць з таго, што “айфон у крэдыт” даўно ёсць часткай мясцовага фальклёру; феноменам, які разам з “папіцот”, “паўкабана”, “Вільня-Беласток” і іншымі апісвае заўважную частку нашай рэчаіснасці. І з ім цікава разабрацца.

Існуе шмат эмпірычных падцверджанняў таму, што выдаткі могуць стымулявацца проста публічнасцю і імкненнем да статуснасці. Тобок, калі грашовы дабрабыт успрымаецца як маркер высокага сацыяльнага статусу, а выдаткі бачныя іншым людзям, людзі перастаюць шкадаваць грошаў. Гэтым тлумачыцца не толькі феномен дэманстратыўнага спажывання, але і такія рэчы, як, напрыклад, дабрачыннасць.

Залежнасці, аднак, не настолькі простыя. Па-першае, сацыяльны статус - рэч адносная. І часам людзей больш цікавяць адносныя, а не абсалютныя рэчы: напрыклад, карэляцыя паміж задаволенасцю жыццём і абсалютным заробкам менш, чым карэляцыя паміж задаволенасцю жыццём і заробкам адносна тваіх суседзяў. Па-другое, у сучасных грамадствах, з улікам іх памеру і высокай ступені індывідуалізму, сказаць who is who даволі складана. Таму мы часта карыстаемся асацыяцыямі і стэрыятыпамі.

Каб зразумець, як усё гэта працуе, можна паглядзець на розніцу ў спажыванні паміж расавымі групамі ў ЗША. Чорныя і лацінасы аддаюць большую частку сваіх бюджэтаў на visible goods (айфоны, плафоны, залатыя ланцугі). Але карэляцыя паміж дэманстратыўным спажываннем і расай існуе толькі на першы погляд. Яна знікае, калі ўлічваць у аналізе сярэдні заробак рэферэнтнай групы - той групы людзей, з якой цябе асацыююць іншыя.

Інакш кажучы, калі ты бедны і чорны, а ўсе навокал лічаць чорных беднымі, ёсць стымулы ставіць на тачку залатыя дыскі і рабіць выгляд, што дэма з тваім рэпам добра прадалося. З іншага боку, калі ты чорны, але з району, дзе жыве шмат паспяховых чорных, можна спакойна перасаджвацца на Форд Эдж. З белымі будзе тая ж самая гісторыя.

Занудную эканамічную тэорыю і матэматычныя мадэлі можна глянуць тут. Мы ж будзем карыстацца сапраўднымі навуковымі канцэптамі: “Fake it till you make it” супраць “Too cool for school”. Калі шмат хто сігналіць праз дэманстратыўнае спажыванне, людзі з насамрэч высокім статусам могуць ад такога спажывання адмаўляцца, каб іх не пераблыталі. Натуральна, такая стратэгія робіцца прывабнай з пашырэннем крыніц інфармацыі пра іх высокі сацыяльны статус.

Тобок, калі ты - беларускі айцішнік і беларускае грамадства ведае, колькі зарабляюць айцшнікі (анлайнер, тутбай і куку не даюць беларусам забыць), магчыма, у цябе няма асаблівых стымулаў сігналізаваць свой заробак праз дэманстрацыю новага айфона. Магчыма, катэгорыя айцшнікаў з бруднай галавой і дзіркамі ў бруках зусім не патрабуе вашага спачування, а з’яўляюцца homo economicus, рацыянальнымі агентамі без стомы і кагнітыўных скажэнняў, якія проста контр-сігналізуюць.

Яшчэ лепш залежнасць паміж дэманстратыўным спажываннем і інфармацыяй можна прасачыць на блізкім беларусам прыкладзе крэдытаў на вяселле, праўда ў Індыі. Калі жаніх - з іншай, далёкай вёскі, пра якую мала чаго вядома, бацькі нявесткі закатваюць больш шыкоўныя вяселлі. Гіпотэза ў тым, што такім чынам бацькі спрабуюць прасігналізаваць высокі статус кавалера, пра якога іхнім суседзям мала чаго вядома. Чым менш вядома, тым менш карэляцыі з рэальным “статусам” жаніха. Пры гэтым, такія практыкі больш распаўсюджаныя ў бедных вёсках.

Дарэчы, аб'ём выдаткаў на вяселле ў Індыі можа дасягаць 6 гадавых заробкаў сям'і. Беларусам ёсць куды расці.
7 Amazing Facts About Top Sites About Science,Technology, Philosophy in Under 10 Minutes Can Make You a Millionaire the Government Doesn't Want You To Know

#everyday

Добрай нядзелі, кацяняты. Зрабіў для вас падборку сайтаў, каб чытаць, калі вы больш не можаце бачыць клікбэйты пра АІ, плачаце ад артыкулаў з назвамі кшталту "Top 10 something...", у вас выцякаюць вочы ад артыкулаў на анлайнеры, ці вы проста вырашылі падцягнуць сваю ангельскую.

Aeon.co – часопіс, які складаецца з нататак сярэдняй даўжыні, а таксама вялікіх эсэ ад прафесіяналаў у розных сферах. Створаны і падтрымліваецца акадэмікамі альбо людзьмі з сур’ёзным акадэмічным бэкграўндам. Кажуць яны пра сябе наступнае: “We ask the big questions and find the freshest, most original answers, provided by leading thinkers on science, philosophy, society and the arts” і гэтае апісанне не вельмі далёкае ад рэчаіснасці. Існуе на данатах, таму ніякага клікбэйта – толькі шчырыя і бясплатныя спробы распаўсюджваць веды. Большасць матэрыялаў, якія мне трапляліся, былі высокай якасці.

Nautil.us - навуковы часопіс, які "combines the sciences, culture and philosophy into a single story." Па канцэпцыі нечым нагадвае Aeon, што адразу робіць яго вартым увагі. У часопіса ёсць непаўторная атмасфера, ад якой хочацца пераглядаць Contact, альбо ляцець у адкрытым космасе пад Still Corners - The Trip. Асноўны мінус - бясплатна даюць прачытаць толькі абмежаваную колькасць артыкулаў у месяц. З іншага боку, гадавая падпіска зараз усяго 24$, якія вы інакш усё роўна аддаціце на чарговы анлайн курс па діджытал маркетынгу.

Longform.org – падборка лонгрыдаў, якія лічацца пэўнай часткай журналісцкага кам’юніці прыкладамі майстэрства ў напісанні тэкстаў. Калісьці мне яго параіў чалавек, які зараз піша артыкулы для Washington Post. Яму дакладна дапамагло

Thebrowser.com – ідэя, падобная на longform, дзе рэдактары абіраюць лепшыя 5 артыкулаў за дзень. Існуе платнае падпіска, толькі я да гэтага часу не разабраўся навошта. Яго чытае Дэвід Брукс, у якога спецыфічныя палітычныя погляды і ўяўленні пра тое, як існуе сусвет, але, магчыма, найбольш моцны публіцыстычны стыль сярод папулярных калумністаў

Wired.com – добры і даволі стары часопіс пра тое, як тэхналогіі змяняюць жыццё. Зараз, па-сутнасці, вялікі навінавы партал з налётам гікавасці. Часам бываюць пытанні да якасці інфармацыі, але як крыніца штодзённай інфармацыі - цалкам ок. З іншага боку, адначасова яны здольныя публікаваць абсалютныя шэдэўры публіцыстыкі. Бясплатны доступ абмежаваны, існуе платная падпсіка.

Technologyreview.com - нечым нагадавае wired, з той розніцай, што фокус тут толькі на тэхналогіі і калісьці часопіс належыў MIT. Зараз куды больш арыентаваны на шырокую аўдыторыю, з усімі плюсамі і мінусамі. Заўважнай асаблівасцю з’яўляецца фокус на экалагічным актывізме, таму калі вам патрэбныя новы ідэі для срачаў на тэму ў фэйсбуках і твітэрах, гэта добры выбар.

Quantamagazine.org - Калі вам спадабаліся Aeon ці Nautilus, але вам хацелася б больш увагі на матэматыку, тэарэтычную фізіку, кампутарныя навукі і менш на ўсё астатняе, дадзены часопіс падыходзіць. Аднак, у адрозненні ад таго ж Aeon большасць артыкулаў напісаная журналістамі, а не навукоўцамі. Што, канешне, не абавязкова дрэнна
Пра беларускі фэйсбук, малпаў, сантыметры, эканамічную няроўнасць і ўважлівасць

#everyday

Уявім сабе вельмі асцярожную малпу міліён год таму. Яна пастаянна бачыла драпежнікаў у афрыканскім гушчары, чым моцна раздражняла сваіх калег - іншых малпачак. “Ты проста бачыш патэрны ў рандомых дадзеных” - казалі яны ёй з дапамогай гукаў і крыкаў рознага дыяпазону і гучнасці. Дададзім у гэтую гісторыю шаблязубага тыгра. Шанцаў, што асцярожная малпа перадала нам свае гены куды больш, чым шанцаў, што менш асцярожныя малпы бегаюць хучэй за тыгра. Так тлумачыцца беспрэцэдэнтная здольнасць людзей бачыць патэрны ва ўсім, чым толькі можна. Ну, ці амаль так.

У беларускім фэйсбуку, на старонцы Сяргея Чалага, на днях з’явіўся прэкрасны прыклад таго, як людзі спрабуюць патлумачыць проста шум у дадзеных. Для тых, хто адмаўляецца кавырацца ў беларускім фэйсбуку, перакажу сутнасць гісторыі. Ourworldindata мае ў сваёй базе дадзеных наступны графік змены сярэдняга росту людзей цягам гісторыі. У ім ёсць забаўны артэфакт - каля 1450 год д.н.э. людзі рэзка зрабіліся заўважна больш высокімі, а потым зноў пачалі быць нізкімі.

Малпа бачыць патэрн - малпа тлумачыць. Мой асабісты фаварыт сярод тамашніх гіпотэз гэта гвалтоўная акупацыя хомасапіенс неандэртальцамі, што і выклікала рэзкі рост наступных пакаленняў. У 1450 годзе да нашай эры. З іншага боку, калі б я, будучы мікенскім войнам каціў на сваёй калясніцы ў 1450 годзе д.н.э. і сустрэў неандэртальца, не ведаю, як б павялі сябе мае сантыметры. Але большасць тамашніх гіпотэз зводзіцца да выбуху вулкана. Прыдумаць, як канкрэтна гэта павінна было стымуляваць рост - тое яшчэ ментальнае практыкаванне.

Цяпер звярнем увагу на шкілетаў, мумій, эканамічную няроўнасць і сантыметры. Так склалася, што калі пры раскопках знаходзяць пахаванні высокастатусных асобаў, іх косткі часта больш чым у суседніх пахаваннях. І гэтаму ёсць даволі простае тлумачэнне: высокі статус дазваляе пазбегнуць голаду і дрэннай дыеты, асабліва ў дзяцінстве, што істотным чынам паўплывае на далейшы рост арганізму. Калі проста: багатыя - жэрлі, бедныя - галадалі.

Да фэйсбучных дэбатаў гэта тычыцца даволі дэтэктыўным чынам. Калі паглядзець, дзе ourworldindata узялі дадзеныя, можна зразумець, што яны проста візуалізавалі таблічку з Hermanussen (2003). Пры гэтым, зрабілі памылку нават у даце публікацыі, што ўжо намякае. Таблічка таксама не арыгінальная, а ўзятая з Angel (1984). Узятая таксама не цалкам, бо на 1450 BC прыведзеныя дадзеныя (і гэта ключавы факт) па Royal, але не прыведзеныя дадзеныя па Commoners, якія на 6.4 сантыметры ніжэй. Тое, што там дадзеныя толькі па пары індывідаў можна зразумець па адсутнасці estimated population density, што і лагічна - адкуль density ў пары шкілетаў з аднаго кургана.

У адпаведнасці, ніякага “аўтлаера” у 1450 ВС, канешне, няма – ёсць неакуратная праца з дадзенымі і шэраг паступовых памылак, якія і прывялі да публікацыі папулярнага, але памылковага графіка. Поўны і правільны варыянт можна глянуць у Boix & Rosenbluth (2014), а менавіта – Figure 1 і Table 3

З ростам аб’ёму даступных дадзеных, было б карысным прывіваць людзям культуру працы з імі. З іншага боку, ёсць меркаванне, што нашым продкам малпачкам было цікавей уяўляць захапляючыя патэрны ў афрыканскім гушчары, а не маркотна кавырацца ў зямлі палкай-капалкай. Так што fair enough.
Пра твайго дзеда, чуму, нацыстаў і ксенафобію

#statistics #politics

Які дзень надвор’е - поўнае абышто, таму збіраюся адцягваць ад яго вашую ўвагу жыццесцвярджальнымі топікамі: чумой, нацызмам і аналізам ўстойлівасці ксенафобіі.

Выглядае, што вера ў тое, што культурныя нормы валодаюць прынамсі пэўнай устойлівасцю, даволі распаўсюджана. Гэта яскрава бачна ў размовах пра менталітэт, нацыянальны ці рэгіянальны, і ягоны ўплыў: менталітэтам спрабуюць тлумачыць карупцыю, адсутнасць дэмакратыі, альбо наадварот - падпарадкаванасць правілам і законам. Могуць нават тлумачыць пэўныя асаблівасці псіхічнага развіцця (калі вы з Вілейкі).

З іншага боку, існуюць прыклады Паўднёвай і Паўночнай Карэі, калі з “аднаго менталітэта”, пад ціскам знешніх сіл, атрымаліся дзве супрацьлеглыя эканамічныя і палітычныя сістэмы. Зараз мы на свае вочы назіраем трансфармацыю нормаў, звязаных, напрыклад, з сэксуальнасцю і чалавечым целам.

Таму пытанне аб устойлівасці нормаў выглядае заблытаным і складаным. Магчыма, варта задаваць больш канкрэтныя пытанні, напрыклад: наколькі ўстойлівай у часе можа быць ксенафобія? Для такіх пытанняў патрэбныя канкрэтныя гісторыі. У мяне адна такая ёсць.

Гісторыя пачынаецца з таго, што сярэднявечная чума – гэта не сучасныя, прылізаныя і эка-фрэндлі пандэміі. У перыяд з 1348 па 1350 год яна выкасіла ў Еўропе амаль палову насельніцтва. Падзея такога маштаба мае шмат балючых эфектаў. Але нас зараз цікавіць адзін канкрэтны – габрэйскія пагромы на тэрыторыі сярэднявечнай Германіі.

Логіку талерантных немцаў тых часоў зразумець даволі проста: адбываецца незразумелы паморак, вакол шастаюць незразумелыя габрэі, якія, да гэтага, яшчэ і менш хварэюць. Дапусціць дурніцу, што справа наўпрост у лепшай гігене, рацыянальныя немцы не маглі. А вось тое, што габрэі, сука, труцяць іхнюю нямецкую ваду ў калодзежах выглядала цалкам лагічнай гіпотэзай. Далей, зразумела, былі пагромы. А вось што было яшчэ далей?

У першай палове 20-га стагоддзя ў Германіі да ўлады прыходзіць НСДАП. Яе ўздым суправаджаецца заўважным ростам антысемітызму. Але ўзровень антысемітызму у розных рэгіёнах Германіі быў розным: ён сістэматычна быў вышэйшы там, дзе ў 14-ым стагоддзі былі пагромы і наадварот - быў нізкі там, дзе пагромаў у 14-ым стагоддзі не было. Напрыклад, у месцах, якія перажылі сярэднявечныя пагромы, у 1920-ых пагромы адбываліся ў 5.6 разоў часцей, чым у месцах, якія іх у той перыяд сваёй гісторыі не перажывалі.

Паглядзім для прыкладу на два нямецкіх гарады: Вюрцбург і Ахен. Сярэднявечны Вюрцбург бачыў габрэйскія пагромы, сярэднявечны Ахен сваіх габрэяў шкадаваў. Потым, у 1928 годзе 6.3% жыхароў Вюрцберга прагаласавалі за нацыстаў (сярэдняя па Германіі - 3.4%). У Ахене - 1%. У Вюрцбергу былі задакументаваныя шэраг пагромаў цягам 1920-ых, у Ахіне - аніводнага. Аналагічную розніцу можна заўважыць таксама па папулярнасці ў гэтых гарадах нацысцкага часопісу Der Stürmer, а таксама маштабам дэпартацыі габрэяў апасля 1933.

Трэба, аднак, памятаць, што паміж гэтымі феноменамі існуе толькі нейкая карэляцыя. Натуральна, для некаторых нямецкіх месцаў дадзеная логіка не працуе. Асноўныя гіпотэзы аўтараў даследвання ў тым, што найменшая карэляцыя паміж чумой 14-га стагоддзя і антысемітызмам 20-га ў тых месцах, якія перажылі найбольш значны рост насельніцтва, а таксама былі чальцамі Ганза - гандлёвага саюзу паўночных і цэнтральных нямецкіх гарадоў.

Буйны рост насельніцтва ёсць сваеасаблівым індыкатарам эканамічнага развіцця: яно не толькі спрыяе натуральнаму дэмаграфічнаму росту, але таксама стымулюе міграцыю - людзі прыяджаюць за лепшым жыццём. Спецыялізацыя на гандлі, у выпадку Ганза, таксама звязаная з часовай, але пастаяннай міграцыяй, эканамічным дабрабытам і агульным даверам да чужынцаў.

У адпаведнасці, месцы, якія перажывалі габрэйскія пагромы 500 год таму, але потым таксама перажылі моцны эканамічны рост і масавую міграцыю, ў 20-ым стг. не адрозніваліся антысемітызмам і заўважнымі сімпатыямі да нацыстаў. З іншага боку, месцы з нізкай мабільнасцю захавалі свае культурныя нормы: працягвалі забіваць габрэяў і праз 500 год.
Карэляцыя, прычынна-следчая сувязь, альтэрнатыўныя сусветы і іншая наркаманія

#statistics

Калі чалавек чытае кнігі Харары, глядзіць Big Bang Theory і ходзіць на лекцыі Асі Казанцавай, ён вельмі модны і ведае як мінімум два смешныя прыклады, калі карэляцыя не роўная прычынна-следчай сувязі. Але маднейшым будзе, калі запытаць: а што роўнае?

Самы шчыры адказ, які можа даць практыкуючы навуковец на пытанне аб тым, што такое прычынна-следчая сувязь, гэта - “да ябіся яно канём”. Не ўсе лічаць такое пытанне асэнсаваным, не кажучы ўжо пра практычную карысць – карысным яго не лічыць амаль ніхто.

Замест, існуе строгая фармалізацыя таго, што такое прычынна-следчы эфект. Прычынна-следчы эфект гэта наўпрост розніца паміж Y калі здараецца Х і калі Х не здараецца: галава баліць, пасля прыняцця аспірыну (X) баліць на 3 з 10 (Y), у альтэрнатыўным сусвеце без аспірыну працягвае балець на 6 з 10 (Y`). Тады прычынна-следчы эфект роўны –3 (Y – Y`). Проста і не вельмі цікава.

Цікава будзе далей. Прыклад вышэй патрабуе наяўнасці альтэрнатыўнага сусвету і доступу да яго. Настолькі ж рэалістычны сцэнар, як нармальнае лета ў Менску ці перамога беларускай апазіцыі на выбарах. Таму, у якасці практычнага кастыля навука выкарыстоўвае рандамізаваныя эксперыменты: набіраем шмат чалавек, выклікаем у няшчасных мігрэнь, палове выпадковым чынам раздаем таблеткі, палове – плацэба і лічым гэтыя дзве групы ідэнтычнымі, а рэалізацыю эксперымента - рэпрэзентацыяй двух альтэрнатыўных сусветаў. Калі эфектыўна адбівацца ад надакучлівых філосафаў з іх дакалупкамі, цалкам працоўная схема.

Выклікаць мігрэнь – гэта весела, але не настолькі, каб не прайсці этычны кантроль. А вось выклікаць, напрыклад, рак – камедыя, якая нікому, апроч нацыстаў у 40-ых, не спадабалася. Тады адкуль мы ведаем, што курэнне выклікае рак лёгкіх? Пра гэта мы і паразмаўляем.

Першая элегантная замена эксперыменту – гэта інструментальныя пераменныя. Калі нас цікавіць эфект Х (курэнне) на Y (працягласць жыцця), нельга проста паглядзець на карэляцыю: тое, што курыльшчыкі жывуць менш, можа быць выклікана, напрыклад, тым, што курыльшчыкі (Х) могуць таксама часцей быць алкаголікамі (Х2 -> X) і калі алкаголь зніжае працягласць жыцця (Х2 -> Y), мы пабачым карэляцыю паміж Х і Y нават калі курэнне ніяк на працягласць жыцця не паўплывае. І яшчэ міліён падобных магчымасцяў.

Інструментальная пераменная (Z) – гэта пераменная, якая ніяк не можа паўплываць на Y, апроч як праз Х. Стандартным прыкладам Z з’яўляюцца акцызы на цыгарэты. Акцызы – гэта закаручкі на паперы, якія здароўе пагаршаць не могуць. Аднак яны паўплываюць на кошты цыгарэт. Адпаведна, павышэнне акцыз можа выклікаць зніжэнне аб’ёмаў курэння (Z –> X) і праз гэты механізм павышаць працягласць жыцця насельніцтва (Z -> X -> Y). Калі ёсць карэляцыя паміж Z і Y, значыць X паўплывае на Y (яна, дарэчы, ёсць і менавіта так у эпідэміялогіі мераюцца негатыўныя эфекты курэння на папуляцыю).

Другая замена эксперыменту – так званы Regression discontinuity design. Уявім, што нас цікавіць эфект стыпендый на акадэмічную паспяховасць. Уявім таксама, што апасля першага курсу студэнтам з сярэднім балам ад 9 давалася стыпендыя і ў другім годзе амаль усе з іх паказалі добрыя вынікі. Ці ёсць пазітыўны эфект стыпендыі на вучобу? Праблема зноў у тым, што альтэрнатыўны сусвет нам недаступны – магчыма, гэтыя студэнты і без стыпендыі былі б лепшымі, як і былі імі на першым курсе. Для вырашэння такіх праблем выкарыстоўваецца т.з. змяншэнне лакацыі – параўноўваюцца толькі студэнты з балам роўна ў 9 і студэнты з наступным мінімальна магчымым балам – скажам, 8.96. Калі можна эфектыўна даказаць, што розніца ў 0.04 – даволі рандомная і не рэпрэзентуе асэнсаванае адрозненне паміж здольнасцямі студэнтаў, можна лічыць дзве групы (студэнты з балам 9 і студэнтаў з балам 8.96) – адной гамагеннай сукупнасцю, а раздачу стыпендыі – рэалізацыяй альтэрнатыўных сусветаў. Можа атрымацца, што студэнты з балам 8.96 працуюць насамрэч лепш, чым тыя, хто атрымаў стыпендыю – больш матывацыі, менш грошаў на геданізм.
Кровосток і некаторыя праблемы сучаснай філасофіі

#philosophy

Добрай раніцы. Лічу, што пачаць гэты панядзелак трэба з разгляду праблем сучаснай філасофіі на прыкладзе тэкстаў Кровосток. Here we go:

"Можно Сдохнуть" і фізічны дэтэрмінізм vs свабода волі

Можно сдохнуть во время крепкого без сновидений сна
Можно сдохнуть когда всех вокруг тупо сводит с ума весна
Можно сдохнуть завязывая в тёмной прихожей нагнувшись шнурок
Можно сдохнуть расфасовав пиздато по пакетикам порошок
Можно сдохнуть короче как и когда угодно,
Так что чувствуй, чувствуй скорее себя свободно

Дадзены ўрывак з’яўляецца маніфестам антычнаму стаіцызму, як практычнай філасофіі, закліканай пазбавіць чалавека турботаў пра рэчы не пад ягоным кантролем. Як вядома, стоікі былі кампатыбілістамі - не бачылі супярэчнасці паміж фізічным дэтэрмінізмам і свабодай волі ці атрыбутацыйнай маральнай адказнасцю. Яны адрознівалі рэчы, якія мы кантралюем: адчуванні, меркаванні і жаданні, а таксама рэчы, якія не: калі і як здохнуць. Яшчэ, стоікі адрознівалі прынцыповую і дапаможную прычыннасць: калі A -> B -> C -> D - прычынна-следчая паслядоўнасць, тады A і B - дадатковыя прычыны D, тады як толькі C - прынцыповая. Стоікі лічылі фізічны дэтэрмінізм толькі дэкларацыяй узаемазвязанасці сусвету праз дадатковую прычыннасць, тады як для свабоды волі дастаткова прынцыповай прычыннасці, калі прынцыповая прычына - нашыя жаданні ці іншыя рэчы пад нашым кантролем. Адпаведна, не гледзячы на тое, што нашыя жаданні таксама выкліканыя дадатковымі фізічнымі прычынамі, стаіцызм, як практычная філасофія, разглядае гэты факт як ірэлевантны - адчуваць сябе свабодным можна і без непазбежнасці смерці па віне нейкіх незнаёмых мудзіл, альбо ставячы на вяртушачкі рарытэтны вініл.

"Думай позитивно" і Problem of Evil

Ты оптимист, ты не слышал, как шипит на коже расплавленный свинец
У тебя крепкий сон, ты не снимал снафф - муви, где к трупу прилип леденец
Ты в хороших с самим с собой, тебе не приходилось грабить стариков
Твой пульс ровный, ты не срезал с людей скальп ради элитных париков

Натуральна, тэксты Кровосток высмейваюць філасоўскі аптымізм Лейбніца альбо веру ў best of all possible worlds як спробу вырашыць т.з. problem of evil. Згодна з духам вальтэраўскай крытыкі аптымізма, тэксты Кровосток падкрэсліваюць, што існаванне снаф-муві з трупамі і ледзянцамі, а таксама практык зразання скальпаў дзеля элітных парыкоў крыху разыходзіцца з ідэяй існавання іманентна добрага Бога, які стварыў людзей па сваім падабенстве і таму мы існуем у лепшым з усіх магчымых сусветаў.

"Простые Слова" і мета-этыка

Трезвость тупее обдолба
Скромность скучнее апломба
Кока-кола популярнее гексогена
Чебурашка моднее крокодила Гены
Инъекции глубже массажа
Костёр горячее пляжа
Слова значительнее поступков
Соски сексуальнее обрубков

Дадзены тэкст адрасуе вядомую праблему мета-этыкі, а менавіта - наяўнасць аб’ектыўных падстаў маралі. Маральны скептыцызм, як вера ў тое, што ніхто не мае эмпірычных ведаў пра мараль, адхіляецца. Замест, пераканаўча дэманструецца эквівалентнасць маральных меркаванняў (“Скромность скучнее апломба”, “Слова значительнее поступков”) і эмпірычных фактаў (“Кока-кола популярнее гексогена”, “Чебурашка моднее крокодила Гены”).

"Ночь" і Bayesian reasoning

Ночь накрыла город и я тоже внутри попался
Странная поебень наша жизнь как говорят китайцы
Хотя эти китайцы - те ещё разводилы с огромным стажем
Тут я с ними согласен - жизнь её хуй проссышь, прямо скажем

Аўтар відавочна сцвярджае прымат Bayesian reasoning як метада пазнання. Ведаючы высокую дакладнасць медыцынскага тэсту, паслухмяны байесавец пры атрыманні пазітыўнага тэсту будзе зніжаць ацэнку верагоднасці наяўнасці ў сябе хваробы са зніжэннем распаўсюджанасці хваробы ў папуляцыі. Аналагічным чынам, ведаючы, што жыццё - дзіўная паябень, а таксама тое, што кітайцы - тыя яшчэ развадзілы, аўтар тэкста справядліва заключае, што развадзільнасці кітайцаў не дастатковая, каб адхіліць моцную першапачатковую гіпотэзу аб тым, што жыццё - тая яшчэ паябень, бо гіпотэза падтрымліваецца вялікай колькасць доказаў, незалежных ад існавання кітайцаў.
"Прыгожую ці разумную", "Багатага ці добрага" альбо іншыя фундаментальныя пытанні патрыярхальнага грамадства часоў позняга капіталізму

#statistics #everyday

Выбіраць сабе партнёра з дапамогай статыстычнага аналізу, вымярэнняў і тэстаў ёсць вельмі эфектыўнай стратэгіяй: так вы пераканаеце патэнцыйнага партнёра ў сваёй адэкватнасці, высокай ступені эмпатыі і адсутнасці аўтызму. Але для таго, каб гэта рабіць, патрэбныя дадзеныя. Зараз мы гэтым і займемся.

Характар людзей звычайна мераюць з дапамогай Big 5 personality traits model. Яна складаецца з 5 характарыстык: Conscientiousness (адказнасць/сабранасць/добрасумленнасць), Extraversion, Neuroticism, Agreeableness і Openness to Experience. Трэба разумець, што гэтыя характарыстыкі не з’яўляюцца эмпірычнымі сутнасцямі самі па сабе, але зручна апісваюць комплексную эмпірычную рэальнасць чалавечага характара. І важна не блытаць мадэлі з тым, што яны апісваюць.

Падабенства характараў мае пазітыўны ўплыў спачатку і таму ёсць шмат доказаў. Аднак, яно мае негатыўны ўплыў на доўгатэрміновае задавальненне шлюбам, калі разглядаць перыяд ад 10 да 20 год. Асабліва негатыўны ўплыў мае падабенства па Conscientiousness і Extraversion. Пры гэтым, падобныя па Extraversion пары і першапачаткова мелі ніжэйшую задаволенасць шлюбам, тады як падабенства па Conscientiousness напачатку не мае ніякага негатыўнага эфекту, але істотным чынам спрыяе дэградацыі шлюба з часам.

Выглядае, што двум арганізаваным, працавітым і амбіцыёзным выпускнікам умоўнага МДЛУ прасцей сыйсціся, асабліва калі толькі адзін з іх – флексер і ўмее ў каралеўскі ніжні брэйк, а другі аддае перавагу серыялам, кнігам ці Доце. Аднак, пры нарастанні істотнасці эфектыўнага размежавання абавязкаў (напрыклад, са з’яўленнем дзяцей), пры падабенстве па Conscientiousness нарастае канфлікт інтарэсаў: у абодвух амбіцыі, у абодвух ПРАВІЛЬНАЕ разуменне таго, як і што рабіць, якое яны змяняюць з вялікімі цяжкасцямі.

Калі разглядаць індывідуальныя характарыстыкі, то высокі бал у Neuroticism негатыўны паўплывае на задавальненне шлюбам, тады як высокі бал у Agreeableness, Conscientiousness і Openness to Experience – пазітыўна. Для Extraversion дакладнай карэляцыі знайсці не атрымалася. Наўрад ці гэта вельмі шакуючыя навіны: нікому не падабаюцца шуганыя неўротыкі, усім падабаюцца арганізаваныя, адкрытыя да новага досведу людзі, з якімі лёгка дамаўляцца.

Калі цікава, тэст на Big 5 можна прайсці тут ці тут.

Цяпер пра тое, што хвалюе кожнага беларуса: заробак. Вядома, што гістарычна рост фінансавай незалежнасці жанчын спрыяў большай ініцыяцыі разводаў з іх боку. Аднак для сучасных шлюбаў, ні фінансавая незалежнасць жанчын, ні агульны прыбытак сям’і не карэлююць з верагоднасцю разводу. Адзіная рэч, якая з ёй карэлюе – адсутнасць у мужчын full-time працы, што вядзе да значнага павелічэння рызыкі разводу. Ведаю, я сам у шоку.

Куды цікавей залежнасць паміж адносным заробкам і здрадамі. Графік настолькі прэкрасны, што вельмі раю да яго дагартаць: старонка 483 выдання, альбо 15/27 самаго pdf. Уявім шкалу, дзе -1 рэпрэзентуе, што зарабляе толькі мужчына, +1 – тое, што зарабляе толькі жанчына, а 0 – аднолькавы заробак. У жанчын залежнасць строга лінейная: з ростам значэння на шкале верагоднасць здрады падае, з 5.5% пры -1 да 1.8% пры +1. Для мужчын залежнасць куды весялей: пры -1 верагоднасць здрадзіць каля 14.5%, потым яна імкнецца да свайго мінімума на адрэзку -0.1 да +0.2 (каля 3%), потым зноў пачынае расці і на +1 выходзіць на 4%. Выснова для жанчын: бярыцеся шлюбам з тымі, хто зарабляе на 20% менш.

Калі спрабаваць тлумачыць гэты феномен, можна звярнуць увагу на гетэрагенны эфект адукацыі: так, каля 85% жанчын лічыць, што пул патэнцыйных партнёраў зменшыўся апасля атрымання імі ступені, тады як 90% мужчын лічыць, што адукацыя наадварот павялічыла колькасць даступных ім партнёраў.
"Прыгожую ці разумную", "Багатага ці добрага" альбо іншыя фундаментальныя пытанні патрыярхальнага грамадства часоў позняга капіталізму. Частка 2

#statistics #everyday

Увесь тыдзень я абмяркоўваю са сваімі знаёмымі папярэдні пост пра статыстыку і пошук партнёраў. Натуральна, усе мы малпачкі і гэтая тэма усіх нас цікавіць. Я вырашыў яе працягнуць, аддаўшы цяпер павагу нашым далёкім продкам.

Некалькі слоў пра біялагічныя тлумачэнні паводзінаў людзей. Яны выклікаюць вялікую незадаволенасць пэўных колаў больш гуманітарнай акадэміі. З аднаго боку, гэта вылікана спадчынай сацыяльнага дарвінізму і папулярнымі некалі практыкамі апраўдваць “прыродай” прымус і эксплуатацыю: іншых рас, іншых народаў, жанчын. З іншага боку, гэта выклікана нізкай падрыхтаванасцю гэтых колаў ў плане эмпірычных даследванняў. Агулам, трэба заўсёды памятаць, што чалавечыя паводзіны комплексныя, на іх уплывае мноства чыннікаў і нават калі біялагічныя тлумачаць частку варыяцыі, яны ніколі не тлумачаць усю.

У Швецыі існуе база дадзеных па адаптаваных дзецях. Як правіла, менавіта такія дадзеныя выкарыстоўваюцца для размежавання сацыяльных і біялагічных эфектаў, асабліва калі біялагічныя бацькі ніякім чынам у выхаванні дзяцей не ўдзельнічалі. Прыкладна год таму выйшла даследванне каля 20.000 адаптаваных дзяцей на прадмет патэрнаў іх сямейнага жыцця.

У выбарку траплялі дзеці, адаптаваныя да 10 год ў поўныя сем’і, толькі пры наяўнасці дадзеных пра біялагічных бацькоў. Гэта дазваляе параўноўваць патэрны сямейнага жыцця паміж імі, іх біялагічнымі і легальнымі бацькамі. Вынікі наступныя: развод легальных бацькоў уплывае на развод дзяцей ў межах ад -14% да +7%, тобок ніяк не паўплывае; развод біялагічных бацькоў строга павялічвае шанец разводу дзяцей, ад +13% да +31%.

Але, у мяне ёсць некалькі пытанняў да гэтага даследвання. Па-першае, планка “да 10 год” падаецца даволі высокай, бо значныя этапы сацыялізацыі ўжо паспелі адбыцца. Гэтую праблема можна было б вырашыць проста ўключыўшы ў аналіз ўзрост адаптацыі. Але гэтага я не знайшоў, што вылікае падазрэнні. Па-другое, адсутнічае кантроль за камунікацыяй паміж адаптаванымі дзецьмі і іх біялагічным бацькамі. Калі такая камунікацыя магчымая, біялагічныя бацькі ўсё яшчэ могуць выступаць для сваіх дзяцей сацыяльным прыкладам. Магчыма, такая камунікацыя абмяжоўваецца законам, напрыклад праз нераскрыццё інфармацыі пра біялагічных бацькоў, але з артыкулу гэта не зразумела, а па-швецку я не чытаю.

Таксама, даволі даўно вядома, што развод аднаго з моназіготных блізнят у значна большай ступені павялічвае верагоднасць разводу другога, у параўнанні са звычайнымі (гетэразіготнымі) братамі і сёстрамі. З улікам таго, што моназіготныя блізняты генэтычна нашмат больш падобныя, гэты факт кажа на карысць наяўнасці генэтычных чыннікаў разводаў.

Цяпер паразмаўляем пра тое, аб чым вы ўсе разважаеце перад сном: пра ваш major histocompatibility complex (HLA). HLA - гэта генэтычны кластэр, які ў вялікай ступені адказвае за адаптыўную імунную сістэму. Прынамсі, гэта тое, як я гэта зразумеў апасля 20 хвілін кавырання ў гугле. Вядома, што вялікая колькасць млекакормячых шукае сабе сэксуальным партнёраў з адрозным HLA, што вядзе да больш варыятыўнай і таму больш эфектыўнай імуннай сістэмы нашчадкаў. Карыстаюцца яны для гэтага сваім абаняннем.

Пытанне ў тым, ці існуюць аналагічныя патэрны сярод людзей. Канешне ж існуюць. Сама здольнасць людзей аддаваць перавагу пахам на падставе ступені адрознення HLA не з’яўляецца вельмі добра даказанай, бо існуюць эксперыменты з канкуруючымі вынікамі. Аднак добра вядома, што ступень адрознення HLA пастаянных партнёраў большая, чым можна было б чакаць by chance. Пры гэтым, нават сярод пастаянных партнёраў большае адрозненне HLA карэлюе са ступенню задаволенасці адносінамі, сэксуальным задавальненнем, а таксама жаданнем завесці дзяцей. Цікава, што першыя дзве залежнасці назіраюцца як сярод мужчын, так і сярод жанчын, але апошняя - жаданне завесці дзяцей ад HLA адрознага партнёра - назіраецца толькі сярод жанчын, тады як мужчын HLA маці сваіх патэнцыйных дзяцей пакідае раўнадушным.
2022 comeback

Вырашыў вярнуцца да гэтага каналу. З даволі простай нагоды.

Такі час, што кожнаму варта рабіць тое, што ён умее і чакаць, што будзе. Я ўмею рабіць статыстычны аналіз так, каб прыносіць карысць людзям. Таксама, відавочная атака на беларускую мову мяне раздражняе і злуе, я хачу нешта з гэтым рабіць. Чым больш беларускамоўнага кантэнту - тым лепш.

Пра мяне:
Я зарабляю на жыццё статыстычныя аналізам. Зараз працую ў кампаніі Flo, дзе будую статыстычныя мадэлі для прадказання розных аспектаў жаночага здароўя, аналізую публікацыі ў медыцынскіх часопісах на прадмет якасці метадалогіі і аналізу, а таксама дызайню даследаванні рознай ступені клінічнасці. Маё хобі - штодзённы аналіз дадзеных, альбо як сучаснаму грамадзяніну разабрацца ў патоку навуковых фактаў, лічбаў, статыстык і як выціснуць з гэтага карыснае, каб палепшыць якасць жыцця. Мне можна пісаць у твітэры ці на пошту: a.v.kazlou@gmail.com

Асноўныя прынцыпы гэтага каналу:
- Спасылкі на першакрыніцы aka peer-reviewed articles і preprints. На платныя артыкулы спасылаюся толькі калі інакш ніяк
- Стараюся тлумачыць вузкаспецыялізаваныя аспекты метадалогіі і статыстыкі так, каб усім было зразумела
- Калі проста тлумачыць не атрымліваецца, буду тлумачыць як ёсць. Лепш так, чым чарговы стылізаваны міф - для іх існуюць трэды ў твітэрах
- Калі раблю для вас графікі ці іншы аналіз, буду старацца даваць спасылкі на код

Тэмы, пра якія я збіраюся распавядаць у бліжэйшы час:
- Вітамін D, ягоная карысць, рэжымы ўжывання, цікавыя факты
- Іншыя карысныя (і не) дадаткі: магній/цынк/розныя ашвагады і г.д.
- Апошнія сацыялагічныя апытанні па Беларусі, іхнія метадалагічныя абмежаванні і практычная карысць
- Крызіс рэплікацыі альбо чаму не варта давяраць кожнаму (большасці) даследванняў у біямедыцынскіх і сацыяльных навуках. Што з гэтым рабіць, калі і каму давяраць
- Як выгадаваць самых разумных/здаровых/таленавітых дзяцей: ці варта катаваць немаўля класічнай музыкай і іншыя падазорныя практыкі эпохі навукпопа
- Гучныя выпадкі фальсіфікацыі дадзеных у даследаваннях, пра якія вы верагодна чулі і пра якія распавядаеце сябрам за настолкамі

Калі вам цікавая нейкая канкрэтная тэма, мне можна пісаць - я, калі будзе магчымасць, пастараюся нешта па ёй прааналізаваць і падзяліцца
Пра вітамін D

#vitamin_d #health #everyday

Калі зайсці на cochrane library і пашукаць інфармацыю пра вітамін D (а менавіта там трэба шукаць медыцынскую інфармацыю) , можна зразумець, што D - гэта новы вітамін C. Там пра ўплыў/лячэнне вітамінам D астмы, рассеянага склерозу, хранічных боляў і яшчэ 89 рэв'ю (сістэматызацыя клінічных доказаў), а таксама дадзеныя пра 15797 клінічных эксперыментаў з вітамінам D. Ёсць, дзе пакавырацца.

Нас цікавіць пераважна уплыў D на настрой. Прычыны даволі простыя: 1) у нас з вамі выдаўся не самы просты перыяд і да нашага настрою ёсць пытанні 2) мы жывем у лакацыі з маленькай колькасцю сонечных дзён. Маленькая колькасць сонечных дзён - мала D. Калі дэфіцыт вітаміна D спрыяе млявасці і абыякавасці да жыцця, у нас праблема.

На гэтым тыдні будзем разбірацца, якія ў нас ёсць на руках доказы і што нам рабіць (спойлер - піць вітамін D).

Калі разглядаць эпідэміялагічныя дадзеныя (проста назіраем за людзьмі, ніякіх эксперыментаў), у нас звычайная праблема карэляцыя vs прычыннасць - гэта людзі мала гуляюць па сонцы і таму сумныя, ці ў іх дэпрэсія і ім агулам цяжка выходзіць з хаты? Але пачнем менавіта з іх.

Я уцягнуў дадзеныя па суіцыдах адсюль і па сонечнай актыўнасць адсюль. Зразумела, што суіцыды - не самая аптымальная аперацыяналізацыя, калі трэба памераць эфект на настрой агулам, без экстрымаў (беларусь, дарэчы, традыцыйна ў топ-5). Ультрафіялет таксама можа быць не лепшай аперацыяналізацыяй. Але гэта было прасцей за ўсё знайсці, так што пачнем з таго, што ёсць.

Першы графік паказвае карэляцыю (па краінах) паміж суіцыдамі і сонечнай актыўнасцю. Яна не моцная, але яна ёсць. Агулам, 16% варыяцыі ва ўсіх суіцыдах на планеце можна "патлумачыць" сонечнай актыўнасцю. Менш сонца - больш суіцыдаў. Другі графік - тыя ж самыя дадзеныя, толькі для 20 найбольш і найменш суіцыдальных краін.

Код для рэплікацыі
Пра вітамін D і дэпрэсію

#vitamin_d #health #everyday

Ад панядзелка пераходзім да аўторка, а ад суіцыдаў - да дэпрэсій. Працягваем разбірацца з эпідэміялагічнымі дадзенымі (не дадзенымі эксперыментаў) пра вітамін D і настрой.

Насамрэч, добрых клінічных дадзеных мала. Гістарычна, вітамін D вывучыўся ў кантэксце лячэння рахіта ў дзяцей, астэапароза і іншых праблем такога кшталту, а ў зусім дагістарычныя часы - туберкулёза. А розныя дрэнныя настроі і дэпрэсіі - праблемы белых людзей былі не ў першым прыярытэце. Таму, напрыклад, шмат дадзеных - выключна пра людзей сталага ўзросту. Але нейкія дадзеныя ёсць, з імі і будзем працаваць.

Даследванне 1:
Швейцарыя, 380 пацыентаў, гаспіталізаваных з дэпрэсіяй (ICD-10 depressive episode). Сярод іх, толькі ў 12.6% узровенень D быў вышэй за 20.8 ng/ml. У 55.5% ён быў ніжэй за 13.87 ng/ml. Агулам, карціна даволі жудасная. Але памятаем пра тое, што карэляцыі гэта не прычыннасць - людзі, якія заграмелі ў шпіталь, маглі месяцамі не выходзіць з хаты. 46% былі гаспіталізаваныя ў зімовы перыяд, што таксама паказальна

Даследванне 2:
Нідэрланды, 1282 чалавекі ўзростам 65-95 год, 169 з дыягнаставанай умеранай (minor) дэпрэсіяй і 26 - з глыбокай (major). У людзей без дэпрэсіі сярэдні ўзровень вітаміна D быў 22 ng/ml, у людзей з любым тыпам дэпрэсіі - 19 ng/ml. Розніца ёсць, але не такая заўважная, калі глядзець на абсалютныя лічбы. Аднак трэба разумець, што сярэдні ўзровень там агулам нізкі - 21 ng/ml. Таксама мяне засмучвае той факт, што ў людзей без дыягнаставанай дэпрэсіі часцей бралі аналізы ў зімні перыяд (26.7% супраць 20.7% і 23.1%)

Даследванне 3:
ЗША, ментальна хворыя падлеткі, 104 чалавекі. Сярод іх, у 34% моцны дэфіцыт - < 20 ng/ml, у 38% проста дэфіцыт - 20-30 ng/ml. У гэтым плане ментальна хворыя амерыканскія падлеткі не моцна адрозніваюцца ад беларусаў. Пры гэтым, у дзяцей з прыступамі псіхозу ўзровень вітаміна D быў 20.4 ng/ml супраць 24.7 ng/ml у астатніх. Зноў тая ж карціна - розніца ёсць, але не драматычная.

З гэтага можна зрабіць наступную выснову. Так, эпідэміялагічныя дадзеныя за тое, што нізкі ўзровень вітаміна D асацыяваны з дэпрэсіяй і іншымі растройствамі, прысутнічаюць. Але розніца не такая заўважная, месцамі зусім дробная. Мае высновы з большага рэзаніруюць з даступнымі мета-аналізамі, напрыклад гэтым.

З такім аналізам ёсць адна даволі істотная праблема - арыентацыя на сярэднія значэнні. Наступным пастом паспрабую патлумачыць, пра што я.
Арыентацыя на сярэдні ўзровень вітаміна D можа быць дрэннай метрыкай, таму што ў паўночным паўшар’і большасць з нас жыве з перманентным дэфіцытам. Тады пытанне - што пра людзей з высокім узроўнем вітаміна D? Адсюль я ўзяў дадзеныя пра колькасць здаровых людзей/з дэпрэсіяй, сярэдні ўзровень вітаміна D і іншыя статыстыкі і правёў простую сімуляцыю. Атрымалася, што ў людзей з > 44.8 ng/ml не бывае дэпрэсіі (гэта разавая сімуляцыя і таму шумная велічыня, але аргумент ілюструе). Усяго ў маёй сімуляцыі сярод 246 чалавек з >30 ng/ml дэпрэсія сустрэлася ў 22. У групе <=30 ng/ml яна сустракалася ў 2.3 разы часцей.

Гэта я пра што. Статыстыка часам можа быць скошаная адносна практычных крокаў. Якая нам розніца, што там у людзей з 21 ng/ml, калі можна мець 50 ng/ml. Маё ўяўленне пра карысць вітаміна D, дарэчы, таксама можа быць скошаным (я хутка пойду ад дзвярэй да дзвярэй ў ягонае імя прапаведваць). Праўда пасярэдзіне у рандамізаваных клінічных даследваннях, пра якія распавяду на днях
Пра вітамін D, дэпрэсію і рандамізаваныя клінічныя даследванні

#vitamin_d #health #everyday

Ад карэляцый пераходзім да прычынна-следчых сувязяў і вывучаем дадзеныя эксперыментаў альбо рандамізаваных клінічных даследванняў.

Даследванне 1:

Метааналіз (групіроўка дадзеных з розных эксперыментаў). 4 эксперыменты, Індыя і Кітай, 948 удзельнікаў. Выснова: прыём вітаміна D змяншае ўзровень дэпрэсіі, памер змяншэння - сярэдні (замяралі яны гэта ў т.з. Cohen’s D. Гэта ўніверсальная метрыка, каб параўноўваць кілаграмы, сантыметры, ступені дэпрэсіі, што заўгодна. Яны знайшлі эфект у 0.58. Калі яго пераводзіць у чалавечы рост, гэта эфект у ~3 сантыметры розніцы паміж эксперыментальнай і кантрольнай групай. Калі вам падаецца, што гэта не шмат, запытайцеся, што на гэты конт думаюць хлопцы 177 см)

Даследванне 2:
Таксама метаанілз. 4923 удзельнікі. Эфект быў станоўчы, але ўжо ў два разы менш - 0.28 (у чалавечым росце гэта ~1.6 сантыметраў). Аднак, самі аўтары адзначаюць 2 нюансы. Па-першае, у гэтых клінічных даследваннях вельмі мала людзей з дэпрэсіяй, агульныя лічбы па розных шкалах дэпрэсіі нізкія. Па-другое, у некаторых з гэтых эксперыментаў дозы былі вельмі маленькія - напрыклад, 400 IU цягам 5 дзён (?????). Тым не менш, статыстычна значны эфект не знойдзены.

Даследванне 3:

(Уключана ў метааналіз 2, але распавесці ўсё роўна цікава)

Нарвегія, 334 удзельнікі, 3 групы - 40.000 IU кожны тыдзень, 20.000 IU кожны тыдзень і кантрольная група з плацэба. Працягласць - 1 год. Замяраўся т.з. total BDI scores. Шкала наступная: 0–13 - няма дэпрэсіі, 14-19 - лёгкая форма, 20-28 - сярэдняя форма, 29-63 - цяжкая форма. У тых, хто год прымаў 40.000 IU, сярэдні бал упаў з 4.5 да 3. У тых, хто прымаў 20.000 IU, бал упаў з 5 да 4. У тых, хто прымаў плацэба, бал упаў з 4 да 3.8, тобок амаль не змяніўся. Вынік - змяншэнне сімптомаў дэпрэсіі з ростам дозы вітаміна D

Высновы
:
- Рандамізаваныя клінічныя даследванні - лепшая крыніца доказаў
- Іх пра вітамін D і дэпрэсію не так шмат - 11, калі я правільна падлічыў
- З ростам дазіровак расце станоўчы эфект
- Эфект альбо слабы, альбо сярэдні. Магічнай пілюляй вітамін D не з’яўляецца
- Для людзей з ужо нармальным узроўнем вітаміна D і з нізкім узроўнем дэпрэсіі заўважнага эфекту хутчэй за ўсё не будзе
Як хутка правяраць медыцынскую інфармацыю

#health #everyday #vitamin_d

Перад тым, як скончыць серыю пра вітамін D, хачу падзяліцца сайтам, якім я карыстаюся, калі мне лянота самому шукаць і аналізаваць даследванні - examine.com. Сайт створаны для акамуляцыі медыцынскай інфармацыі ў адзін фармат і не прымае данаты, спонсараў, на ім няма рэкламы і г.д.

Як карыстацца:
- Уводзім назву прэпарата/рэчыва/г.д., якое нас цікавіць
- У іх ёсць секцыі How to Take (пра дазіроўкі) і Human Effect Matrix
- У Human Effect Matrix ёсць 5 калонак:
- Level of evidence, пра тое, які аб’ём высокаякасных доказаў. Пад імі маецца на ўвазе рандаізаваныя кантрольныя даследванні. Чым больш, тым лепш
- Outcome, на што паўплывае
- Magnitude of effect, наколькі моцна паўплывае
- Consistency of Research Results, наколькі даследванні сябруюць паміж сабой (паказвалі адное і тое ж)
- Notes, падсумаванне і ўсялякая дататковая інфармацыя
- Найбольш істотным з’яўляецца камбінацыя калонак Level of Evidence і Consistency of Research Results. Калі абодва значэнні высокія, таму, што напісана, можна давяраць. Калі так шукаць лянота, проста чытаем/перакладаем калонку Notes. Там звычайна добрае падсумаванне.
- Нармальна перакладаецца гугл хромам

На прыкладзе вітаміна D:
Калі глядзець на найбольш даказаныя эфекты вітаміна D (высокія Level of Evidence і Consistency of Research Results), спіс наступны:
- Менш частыя прыступы астмы
- Зніжэнне рызыкі інфекцый дыхальных шляхоў
- Зніжэнне рызыкы пералому костак
- Зніжэнне парашчытападобных гармонаў