Science & Health Writing
3.19K subscribers
33 photos
3 videos
2 files
236 links
Канал Екатерины Кушнир о научной и медицинской журналистике. Рассказываю о том, что показалось интересным и полезным.

Для связи: @Ekaterina_Kuschnir Рекламы нет
Download Telegram
​​Подборка англоязычных сайтов с красивыми и полезными данными

Подборка ресурсов, чтобы искать информацию для статей или вдохновляться идеями. Также подойдут, чтобы смотреть, как можно визуализировать различные данные.

Наш мир в данных

Известный сайт, где собраны данные по экономике, медицине и другим направлениям. Например, там можно посмотреть, сколько людей в разных странах погибает от употребления наркотиков или где какой уровень неравенства. Все это упаковано в интерактивные диаграммы и графики. Сайт регулярно обновляется, он бесплатный. Цель проекта — сделать доступными данные, которые помогут решить мировые проблемы.

Визуальный капиталист

Огромная библиотека визуализаций, основанных на самых разных данных о медицине, экологии, экономике, демографии, технологиях и многом другом. Один из лучших, на мой взгляд, ресурсов, где можно посмотреть актуальные данные в красивом формате и с пояснениями, а также найти ссылки на их источники. Все бесплатно, цель проекта — тоже сделать данные понятнее и доступнее для широкого круга людей.

Работа с данными

Можно найти графики с данными о чем угодно — от количества книг Агаты Кристи и их распределения по языкам до использования возобновляемой энергии в Боливии. Не все важные данные свежие — например, данные об экономике стран могут быть за 2021 год, с которого там многое изменилось. Но бывают и совсем новые.

Глобальная база ВОЗ

Множество визуализаций от Всемирной организации здравоохранения — можно найти много интересного от данных по причинам смертности в мире до распространенности конкретных болезней по регионам.

Открытые данные Всемирного банка

Уровни доходов по странам, инфляция, рост цен на продукты питания и прочие экономические (и не только) показатели в удобных графиках.

Информация прекрасна

Это сайт Дэвида МакКэндлесса, где публикуют классные визуализации актуальных данных из разных источников. Можно посмотреть для вдохновения или поиска источников, откуда эти данные получены.

Система

Граф данных, в основном отражающий связи между заболеваниями и различными факторами. Например, можно посмотреть, какие факторы влияют на мигрень, а также к каким последствиям она приводит. Можно залипнуть на пару часов.

Экономист

Ежедневные графики от The Economist — источник вдохновения и полезной информации. Чтобы их просматривать, надо зарегистрироваться на сайте.

Открытые данные Google

Это агрегатор от Google, который собирает ссылки на общедоступные данные и прогнозы от ряда международных организаций и научных учреждений. Есть поиск по ключевым словам. Пригодится, если нужно найти что-то специфическое.

👉 Знаете другие интересные ресурсы — делитесь в комментариях)

❤️ Еще могу порыться в закладках и собрать такую подборку с русскоязычными ресурсами — ставьте сердечки, если интересно.

😍 На рисунке — население разных стран. Размер площади на диаграмме зависит от количества живущих там людей.

#sciencewriting
Работает или не работает

В комментариях к статьям про неэффективность каких-либо методик лечения или препаратов часто пишут: «А где доказательства, что это не работает? Если нет доказательств, то может работать».

Этот вопрос кажется логичным, но только на первый взгляд.

На самом деле, чтобы использовать препарат или методику в медицине, нужны доказательства того, что это работает. Их отсутствие — подтверждение отсутствия эффекта, данные «против». А вот если нет доказательств, что препарат или методика не работают — это не значит ничего.

Почему это так? Представим, что человек попал в больницу с инфарктом и ему нужна срочная операция на сосудах, у которой есть доказанный эффект. Но врач начинает поить его соком сельдерея, ведь нет доказательств того, что он бесполезен при инфарктах — вдруг поможет.

На таком примере хорошо видно, что эта логика приводит к смерти пациента. В менее критических ситуациях вроде лечения насморка гомеопатией или УВЧ при артрите все не так очевидно. Отсутствие доказательств эффективности тут мало кого смущает, а меньше всего тех, кто продает подобную терапию.

Даже некоторые медицинские журналисты делают эту ошибку — ищут доказательства неэффективности средства, а потом делают вывод, что, может быть, у него есть эффект, раз таких нет. Но «может быть» — плохое основание, чтобы советовать методику или препарат людям. Нет доказательств эффективности — значит, на этом этапе оно неэффективно.

🌈 Мне нравится фраза Карла Сагана: «Экстраординарные утверждения требуют экстраординарных доказательств». Чем удивительнее методика, тем более вескими должны быть подтверждения ее эффективности. Если смотреть с этой точки зрения, становится еще яснее — факт, что никто не доказал отсутствие эффекта, не выглядит убедительным доказательством и никак не подтверждает эффективность чего-либо.

#sciencewriting
Что стоит знать об относительном и абсолютном риске в медицине

Часто в заголовках медицинских новостей или статьях можно прочитать что-нибудь такое: «Чай повышает риск рака в десять раз» или «Любители морковки в два раза чаще болеют деменцией». Звучит пугающе, но в реальности все зачастую не так плохо.

Проблема в том, что авторы обычно берут из исследований показатели относительного риска. Однако, чтобы оценить, насколько какой-либо фактор в реальности влияет на заболеваемость, нужно знать абсолютный риск. Попробую объяснить разницу.

👉 Все примеры вымышлены, брала самые простые — иначе легко уйти в статистические дебри, где легко запутаться. Поверхностно разберу оба понятия, без подробностей о математических расчетах.

В чем разница между относительным и абсолютным риском

Предположим, вы прочитали, что картошка увеличивает риск диабета в два раза. Речь как раз идет об относительном риске — это сравнение вероятности события в двух группах людей. Например, на одних действует фактор риска, на других нет, либо одни получают лечение, другие нет. В нашем примере одна группа ела картошку, а вторая нет — потом ученые сравнили, где больше людей с диабетом.

В чем тут проблема? Мы знаем, что риск у любителей картошки в два раза больше, но не знаем, в два раза больше чего.

Проблему помогает решить абсолютный риск — это показатели риска для каждой группы людей. Допустим, в группе тех, кто не ел картошку, диабет развился у пяти людей из 50, а в группе тех, кто ел — у 10 из 50. Абсолютный риск для первой группы — 10%, для второй — 20%. Разница 10 процентных пунктов — не сказать, что много. А вот если мы сравним риски двух групп и посчитаем относительный риск, то увидим рост в два раза — звучит уже совсем иначе.

Еще пример — картошка на треть увеличивает риск деменции. Это может означать, например, что из 100 человек, которые не едят картошку, трое заболеют деменцией, а из 100 любителей картошки — четверо. Воздействие фактора добавляет одного человека с деменцией на сотню — тоже не так пугающе, как увеличение риска на треть.

То есть относительный риск — это соотношение абсолютных рисков в двух группах. Отсюда следует: даже если что-то увеличивает риск чего-то в 10 раз, в реальности это может ничего не значить. Чтобы понять, стоит принимать во внимание эту информацию или нет, надо найти в исследовании показатели абсолютного риска.

Если они не доступны, могут помочь данные о распространенности заболевания. Например, в статье пишут, что риск заболеть редкой болезнью Фунге-Пунге из-за кофе увеличивается вдвое. Но эта болезнь встречается у одного человека на 1000, то есть исходный риск заболеть 0,1%. Получается, кофе увеличит его всего лишь до 0,2%.

Еще абсолютный риск поможет лучше понять эффективность чего-либо

Например, из двух групп по сто человек одна не занималась спортом, а вторая занималась. В первой группе стенокардией заболело 2 человека — 2%, а во второй — один, или 1%. То есть люди, которые занимаются спортом, вполовину реже болеют стенокардией.

Но, допустим, что в первой группе заболело 20 человек — 20%, а во второй — 10, или 10%. Снова те, кто занимается спортом, вполовину реже болеют стенокардией. Однако в первом случае абсолютный риск снизился на 1, а во втором — на 10 процентных пунктов. Разница есть.

Другой пример — мы читаем, что препарат снижает риск смерти в два раза. Но разница между абсолютными рисками будет, допустим, всего 0,1 процентный пункт. Получается, что из 1000 человек, получивших лечение, умрет на одного меньше. Стоит ли использовать такую терапию, зависит от кучи факторов, в том числе тяжести побочных эффектов — их получит вся 1000, а пользу только один.

#sciencewriting
​​Про оценку результатов скрининговых исследований

В продолжение темы оценки рисков — встретила в одном курсе хороший пример, упростила и делюсь с вами.

Существует некий тест на рак. Пусть его чувствительность — доля действительно положительных результатов, когда рак есть и он выявлен, будет 90%.

Специфичность тоже высокая — пусть доля ложноположительных результатов, то есть людей с положительным тестом, но без рака, будет всего 10%.

Теперь представим человека с положительным тестом — какова вероятность, что у него рак? Нет, не 90% 😊

Посчитать легко, если знать распространенность болезни. Допустим, она 1% — из 1000 людей больны 10. Тогда:

1⃣ Из этих 10 у 9 анализ будет положительным — помним, что чувствительность теста 90%. У одного тест рак не увидит.

2⃣ Остаётся 990 здоровых людей. У 99 из них тест будет положительным — те самые 10% ложноположительных результатов. 

3⃣ Всего получается 108 людей с положительным тестом — 99 здоровых и 9 нет. 

4⃣ Теперь легко вычислить вероятность того, что наш человек попадет в категорию больных — считаем процент людей с раком от всех с положительным тестом. Выходит около 8%, а вероятность того, что болезни нет — целых 92%, несмотря на результат.

▶️ Нагляднее на картинке — нарисовала по-старинке на бумажке 😀

#sciencewriting
Как найти работу научным журналистом или редактором: часть 2

Здесь коротко расскажу о подводных камнях, которые могут ждать на этом пути.

😢 Буду честной — сейчас переход из IT в научную коммуникацию оправдан только в случае, если вам действительно это интересно.

В IT человеку с мозгами и навыками работы с текстом найти работу намного легче — и получать за эту работу он в среднем будет больше. Особенно, если уже есть нужный опыт. Мне иногда пишут работодатели — и 90% вакансий, которые они предлагают, связаны с IT, хотя я уже три года не работаю в этой нише.

💸 Я уходила из IT обратно в медицинскую редактуру в более благоприятных условиях.

Во-первых, мне было, куда идти — у меня был нужный опыт, и я сразу же сменила место главреда в IT-компании на комфортную по времени и деньгам позицию медицинского редактора в крупном бренд-медиа.

Во-вторых, это было еще до войны. Тогда казалось, что сфера будет развиваться дальше. Нельзя сказать, что сейчас она совсем умерла, но перспектив стало меньше. Площадок, фондов, организаций, медиа, где нужны настоящие научные коммуникаторы, редакторы и журналисты, и так было немного, а теперь их можно по пальцам пересчитать — при этом некоторые будут «нежелательными», «иноагентами» и так далее.

То есть найти работу стало тяжелее — это затронуло все ниши, но научную коммуникацию, на мой взгляд, сильнее всего. Здесь дорогие и трудоемкие тексты, по ряду причин их сложно дистрибутировать, просвещение в трудные времена всегда уходит на задний план — или перерождается в пропаганду.

👉 Кроме того, значительная часть вакансий на российском рынке на самом деле не имеет отношения к научной журналистике и коммуникации — так было и раньше, но сейчас, кажется, стало заметнее.

Название позиции будет одно, а в реальности придется или продвигать чьи-то услуги/товары/препараты, «просвещая» людей так, как выгодно клиенту, или выполнять функции пиарщика, штампуя бессмысленные пресс-релизы, или писать статьи в духе «Ученые раскрыли, в чем смертельная опасность микроволновок».

👾 Если знаете английский язык, можно посмотреть зарубежные площадки — их больше, условия там обычно интереснее. Я пока изучаю этот вопрос, но в целом выглядит так, что за границей работа научного коммуникатора или журналиста востребованнее, чем у нас.

У меня к вам встречный вопрос — какие курсы проходили, какие понравились, а какие нет? Если не сложно, напишите в комментариях, в личку или через форму. Очень интересно 😊

#sciencewriting
В чем разница между распространенностью заболевания и заболеваемостью

Минутка эпидемиологии. Разберем два понятия, которые часто путают, — со мной тоже такое случалось.

Распространенность показывает все случаи заболевания в популяции в определенный момент или за определенный период времени. Важно то, что этот показатель включает как новые случаи, так и те, что уже есть.

Например, есть 10 000 человек, из них болями в спине страдает 1000. Получается, что распространенность болей в спине — 1000/10000, то есть 10%, или 100 случаев на 1000 человек.

👉 Распространенность нужна, чтобы понять, сколько людей в мире/регионе/стране живут с заболеванием. Также можно брать разные группы людей и смотреть распространенность среди них — например, считать только пожилых людей, женщин, мужчин и так далее.

⚡️Этот показатель будет меняться, когда люди выздоравливают или умирают — ведь уменьшается общее число случаев заболевания во взятый момент или период.

Тут есть подвох. Высокая распространенность или ее рост не всегда означают проблему, а низкая распространенность или ее снижение — не всегда хорошо.

Так, высокая распространенность может быть связана с плохой тенденцией — больше людей заболевает, а может с хорошей — больше людей выживают и продолжают жить с болезнью. Например, сахарный диабет первого типа раньше лечить не умели, люди просто умирали — распространенность была ниже. А сейчас она выше — люди с диабетом в среднем живут почти столько же, сколько и остальные.

Низкая распространенность болезни тоже может быть связана как с хорошими тенденциями — меньше новых случаев, быстрое выздоровление, так и с плохими — больше смертей.

Заболеваемость показывает новые случаи заболевания в популяции за определенный период времени.

Например, есть 10 000 человек, за год у ста из них появляются боли в спине. Заболеваемость будет 100/10000, то есть 1%, или 10 человек из 1000.

👉 Заболеваемость в основном нужна для оценки скорости распространения заболевания среди людей. Ее тоже можно смотреть по населению мира/региона/страны в целом или по отдельным группам — женщинам, мужчинам, детям, пожилым людям и так далее.

⚡️Заболеваемость может оставаться постоянной, в то время как распространенность растет. Такое как раз случается, когда мы учимся лечить хронические болезни. У того же диабета первого типа число новых случаев может быть постоянным, потому что заболевание больше связано с генетическими факторами, а число людей с ним в популяции будет расти с ростом прогресса в лечении.

Может быть и так, что заболеваемость растет, а распространенность не меняется — когда люди быстро умирают или выздоравливают от болезни. Тогда число новых случаев растет, но общее число людей с болезнью в популяции остается примерно одинаковым.

#sciencewriting
Почему с данными систематических обзоров тоже могут быть проблемы

Систематические обзоры находятся на вершине пирамиды доказательной медицины, потому что объединяют результаты многих исследований и позволяют оценить их в комплексе. Но и к ним нужно относиться критически.

Кокрейновское сообщество выделяет 5 факторов, снижающих качество доказательств обзоров исследований.

⓵ В обзоре оценивали исследования низкого качества, то есть с погрешностями в дизайне. Если объединить результаты исследований, которые не дают достоверных данных, то и обзор будет недостоверным.

⓶ В обзор включены исследования, которые только косвенно касаются изучаемого вопроса. Например, сравнивают два препарата, но нет исследований, оценивающих их взаимодействие, есть только эксперименты, где сравнивают каждое лекарство с плацебо. В таком случае сравнить два средства можно только косвенно.

⓷ В обзор включены исследования с противоречивыми результатами — это называют гетерогенностью, и для этих противоречий нет объяснения. Например, часть исследований показывает заметный эффект от препарата, а часть — не показывает эффекта или он незначительный. Это может быть нормой, если различия связаны, например, с разным эффектом в разных группах людей. Но если авторы не могут правдоподобно объяснить расхождение данных, то качество обзора под вопросом.

⓸ В обзор включены исследования с маленькой выборкой — и даже после их объединения участников все равно мало, чтобы точно оценить результаты.

⓹ Есть признаки предвзятости обзора — то есть в него включены только исследования, которые подтверждают выводы. Самый очевидный пример — в обзор исследований эффективности добавки включили лишь несколько небольших положительных исследований, профинансированных производителем. Такое же бывает, если, например, ученые публиковали только исследования с положительным результатом, а те, что ничего не показали, не публиковали.

㊉ Даже если обзор качественный, это еще не значит, что на нем можно основывать какие-то рекомендации.

Например, есть кокрейновский обзор влияния зверобоя на течение депрессии. Он показал, что трава так же эффективна, как антидепрессанты. Значит ли это, что зверобоем можно лечить депрессию? Нет, как минимум потому, что дозировку активных веществ в добавках вне исследования вычислить сложно, а еще трава негативно влияет на действие многих лекарств.

#sciencewriting
​​Что такое черри-пикинг и почему важно его замечать

Черри-пикингом часто называют выборочное представление фактов. Дословно переводится как «сбор вишенок» — сборщик ягод выбирает или самые привлекательные ягоды, или те, что ему доступны.

Такое встречается не только в журналистике, а практически везде. Например, когда руководитель отдела показывает гендиректору только ту информацию, что представляет его отдел в выгодном свете, — это тоже черри-пикинг.

👉 Неосознанный черри-пикинг связан с когнитивными искажениями, такими как эвристика доступности — то, что легче найти или вспомнить, ложится в основу суждения о чем-либо, и предвзятость подтверждения — склонность людей лучше замечать факты, подтверждающие их точку зрения. А сознательный становится инструментом разных неблаговидных манипуляций с информацией.

👉 Черри-пикинг отличается от обычной лжи тем, что основан на реальных фактах — просто не на всех, а на тщательно подобранных. Из-за этого его бывает сложно выявить. На стратегии черри-пикинга базируются многие лженаучные дисциплины — берем единичные исследования, факты и события, получаем мощную базу для обоснования почти чего угодно: от гомеопатии до астрологии. Однажды мне прислали статью про «доказательную» остеопатию — внешне она не отличалась от качественных научно-популярных статей, вот только многие факты автор обходил стороной.

👉 Черри-пикинг может сказаться на результатах систематических обзоров исследований — если авторы отбирают только нужные данные, это, по сути, становится фальсификацией результата. Из-за этого научное сообщество вынуждено было разработать строгие правила подготовки таких обзоров. Однако сами эксперименты тоже можно интерпретировать по-разному, если брать только нужные данные. Для этого есть другой интересный термин — «метла Оккама»: исследователи как бы заметают лишние данные под ковер, чтобы они не мешали интерпретировать реальность нужным образом. Манипуляции с отдельными исследованиями отследить сложнее, что создает массу проблем.

⚡️Бороться с предвзятостью и взвешенно оценивать данные сложнее, чем насобирать фактов для подтверждения выбранной точки зрения — именно поэтому черри-пикинг так часто встречается в научно-популярных и других статьях. Но если задаться целью и тщательнее работать с информацией, то выборочного представления фактов можно избежать.

❤️ Автор комикса: Gordon Rugg. У него есть еще забавные на эту тему.

#sciencewriting
​​Виды медицинских исследований

Думаю, стоит разобрать этот базовый, но важный вопрос. Поговорим об исследованиях с участием людей, не касаясь тех, что проводят в пробирке или на животных.

👉 Во-первых, бывают наблюдательные исследования — когда ученые изучают ситуацию, не вмешиваясь в ход событий, и клинические эксперименты — когда то, что происходит, спланировано учеными. Наблюдательные исследования не показывают причинно-следственные взаимосвязи, только корреляции, поэтому их выводы желательно проверять в экспериментах.

Наблюдательные исследования

Они могут быть описательными — когда описывают закономерности, чтобы сформулировать гипотезу, и аналитическими — когда изучают корреляции между факторами, пытаясь подтвердить или опровергнуть гипотезу. Также исследования бывают ретроспективными — когда изучаемые исходы уже произошли, информацию собирают задним числом, и проспективными — когда некие события только ожидаются в будущем.

1⃣ Клинические случаи или серии клинических случаев — например, врач зафиксировал новые симптомы у одного либо нескольких пациентов и описал их. По сути, это подробное описание историй болезни с лечением и исходами, а также выявлением закономерностей, если речь идет о группе людей.

2⃣ Поперечное, или одномоментное исследование — берут группу людей и изучают их в конкретный момент времени. Например, проводят опрос среди мужчин определенного возраста, собирая информацию о проблемах с сердцем и рационе.

3⃣ Экологическое исследование — когда проблему изучают на уровне популяции или групп внутри популяции. Например, заболеваемость раком легких в разных городах либо среди мужчин и женщин. Обычно основаны на информации из государственных или других баз данных.

4⃣ Исследование «случай — контроль» — берут две схожие группы людей: одну с каким-то признаком, а другую без него, и сравнивают их. Например, мужчин старше 50 лет с гипертонической болезнью и без нее — так можно заподозрить, что с первыми не так и почему они заболели.

5⃣ Когортные исследования — какое-то время изучают группу людей со схожими характеристиками. Такие исследования относят к лонгитюдным — то есть, в отличие от поперечных, информацию собирают не один раз, а несколько.

Зачастую когортные исследования длятся долго. Например, ученые 20 лет изучают группу мужчин с 30—34 лет, фиксируя инфаркты, а также особенности их жизни: рацион, активность и так далее. Или 25 лет наблюдают за курящими людьми, чтобы увидеть, что с ними происходит.

Клинические эксперименты

В этом случае ученые берут группы людей и воздействуют на них нужным образом. Например, одна группа спортсменов получает перед тренировками специальный напиток, вторая — обычную воду, а потом ученые оценивают выносливость и силу.

Качественные клинические исследования должны быть:

⚡️рандомизированными — люди случайно распределены между группами;
⚡️плацебо-контролируемыми — одна из групп должна получать «пустышку»: воду, как в примере выше, или таблетку из крахмала, когда проверяют новые лекарства. Это нужно, чтобы исключить эффект плацебо. Иногда вместо «пустышки» используют старый препарат, например, если людей неэтично оставлять без лечения;
⚡️двойными слепыми — ни врачи, ни участники не знают, кто в какой группе.

Обычно исследования лекарств проводят в несколько фаз. В первую фазу на небольшом числе участников смотрят, безопасен ли препарат и какие дозы лучше использовать, во вторую фазу берут группу больше и начинают оценивать эффективность, в третью фазу изучают эффективность на большой выборке — обычно от 1000 человек. Четвертая фаза — когда данные собирают после начала продаж препарата.

Если расположить исследования по силе доказательств от большей к меньшей, то первое место займут клинические эксперименты. Далее идут когортные исследования и исследования «случай — контроль», а потом уже все остальные.

#sciencewriting
​​В чем разница между скринингом и ранней диагностикой

Небольшая заметка о понятиях, которые часто путают.

1⃣ Скрининг — обследование целевой группы людей без жалоб. Позволяет выявить болезнь на стадиях, когда симптомов нет, а в случае рака еще и предраковые состояния. Например, маммография у всех женщин старше 40—50 лет — это скрининг.

Эффективные скрининги есть не для всех болезней. Например, в случае с раком для большинства людей работают программы по диагностике рака шейки матки, молочной железы и кишечника.

Хороший скрининг дает такой результат: человек, у которого выявили болезнь на обследовании, живет дольше того, у которого ее нашли позже. Речь именно о продолжительности жизни, а не о годах с диагнозом. Например, если у одного человека нашли рак в 30 лет на скрининге, а у его сверстника в 40 лет из-за жалоб, но оба умерли в 50 — скрининг неэффективен. А вот если первый человек пережил второго на 10 лет, так как раньше начал лечиться, скрининг годный.

2⃣ Ранняя диагностика — обследование людей с жалобами. Помогает выявить болезнь на начальных стадиях, но когда уже есть те или иные проявления. Например, маммография из-за того, что женщина пришла к врачу с болезненностью в одной груди, или из-за того, что врач осмотрел пациентку и заметил нечто подозрительное.

Ранняя диагностика лучше работает, если врачи и пациенты знают, из-за каких признаков стоит назначить дополнительное обследование, а из-за каких нет.

👉 картинка с сайта ВОЗ

#sciencewriting
​​Почему нельзя верить статьям вроде «Ученые доказали, что долгая работа ведет к гипертонии»

Потому что их авторы путают корреляцию и причинно-следственную связь:

👉 Корреляция — переменные статистически связаны: когда меняется одна, меняется и другая.
👉 Причинно-следственная связь — переменные влияют друг на друга: изменение одной вызывает изменение другой.

Корреляция не всегда означает причинно-следственную связь, но причинно-следственная связь всегда подразумевает корреляцию.

🙄 Между долгим рабочим днем и гипертонией будет как раз корреляция — о чем и предупреждают авторы исследования, по которому писали новости. Чтобы понять, есть ли причинно-следственная связь и как переменные вообще взаимосвязаны, нужны дополнительные исследования.

🙌 Корреляция не равна причинно-следственной связи по разным причинам. Например, на переменные может влиять третий фактор или они вовсе связаны случайно. Скорее всего, что-то подобное происходит и в нашем примере, хотя многие смешивающие факторы вроде образа жизни исследователи исключили. Например, люди могут перерабатывать, потому что склонны к тревоге из-за результатов, и та же тревожность влияет на сердечно-сосудистую систему.

Во многих исследованиях также непонятно, какая из переменных первична. Например, если у людей с депрессией снижен уровень витамина D — неизвестно, это недостаток соединения привел к депрессии или из-за депрессии развился его дефицит: человек может не выходить на улицу и плохо питаться.

Только корреляцию показывают многие научные исследования. Причинно-следственную связь можно проверить в контролируемых экспериментах — в таких исследованиях прямо указывают на нее и пишут: causal relationship или causation. Еще иногда о причинно-следственной связи можно говорить, если накоплено много разных данных, позволяющих предполагать, что одно вызывает другое. Про виды исследований в медицине у меня есть отдельный пост.

То есть вместо «длинный рабочий день приводит к гипертонии» правильнее написать: «люди, которые много работают, чаще страдают гипертонией» или «долгая работа связана с гипертонией».

#sciencewriting
Please open Telegram to view this post
VIEW IN TELEGRAM
Как оценивают данные наблюдательных исследований

Наверное, все знают, что причинно-следственную связь можно установить только с помощью контролируемого эксперимента, а наблюдательное исследование показывает только корреляции. Что тогда делать в ситуациях, когда не получится экспериментировать с людьми? Например, нельзя заставить одну группу 10 лет пить пиво, а вторую нет: можно только изучать реальных пьющих и непьющих людей.

В таких случаях можно использовать наблюдательные исследования, чтобы с высокой точностью заподозрить причинно-следственную связь, но при условии, что данных достаточно и они соответствуют определенным критериям. Такие критерии в 1965 году сформулировал британский эпидемиолог и статистик Остин Хилл — в модифицированном виде они актуальны и сейчас: ученые применяют более серьезные методы, но для всех остальных они сгодятся.

9 критериев причинно-следственной связи

1⃣ Чем сильнее корреляция, тем выше вероятность причинно-следственной связи. Например, рак легких у курящих встречается в 15—30 раз чаще, чем у некурящих — такие цифры позволяют предполагать, что курение вызывает рак.

2⃣ Корреляция подтверждается в разных исследованиях, в том числе в тех, что проводили разные ученые в разных местах и в разное время, то есть результат воспроизводим. Например, то, что переработанное мясо повышает риск рака и сердечно-сосудистых заболеваний подтверждалось во многих исследованиях, в том числе крупных: их несколько десятков.

3⃣ Взаимосвязь специфична — эффект сложно объяснить другой причиной. Опять хорошим примером будет курение: многие курящие умирают от рака легких. А вот если бы они с одинаковой частотой умирали от разных болезней или на всех действовали другие значимые факторы риска, причинно-следственную связь установить было бы сложнее.

4⃣ Причина идет раньше следствия — люди сначала начинают пить, а потом у них развивается цирроз печени. Главное, не пропустить обратную причинность. Например, люди с ожирением чаще пьют газировку без сахара — вряд ли это значит, что напиток вызывает ожирение, скорее, наоборот: люди с лишним весом пытаются потреблять меньше сладкого.

5⃣ Чем сильнее воздействие, тем выше вероятность события — это называют зависимостью «доза-эффект»: чем больше человек курит, тем больше рискует заболеть раком легких. Если такая зависимость выражена, можно заподозрить причинно-следственную связь. Хотя иногда для события достаточно присутствия фактора, а сила его воздействия не важна.

6⃣ Существует правдоподобное объяснение корреляции — некий биологический механизм, в который укладывается происходящее. Например, понятно, почему сигареты вызывают рак легких, а алкоголь цирроз печени.

7⃣ Результат исследования согласуется с существующими теориями и прошлыми данными, в том числе лабораторными, а не противоречит им и не является неоднозначным. И снова хороший пример — курение: большинство исследований показывают связь с раком легких, а не, допустим, 50% с болезнью, а 50% с ее профилактикой. Чем больше согласующихся данных, тем лучше.

8⃣ Прекращение или изменение воздействия приводит к изменению результата. Например, у бросивших курить риск рака легких снижается.

9⃣ Аналогичные воздействия приводят к похожим результатам. Допустим, если курение табака вызывает рак легких, то вдыхание других продуктов горения может давать похожий эффект — и исследования это показывают, например, для угля и древесины. Если такие данные есть, они будут еще одним аргументом в пользу причинно-следственной связи.

Чем больше критериев набирается, тем лучше. Если собраны все или почти все, то хорошо, чтобы у ученых получилось подтвердить результаты еще и экспериментально, например, в рандомизированном контролируемом исследовании, но даже если нет — скорее всего, причинно-следственная связь существует.

#sciencewriting
​​Парадокс Симпсона

Интересное явление в статистике, когда тенденция заметна в нескольких группах связанных данных, если рассматривать их по отдельности, но исчезает или меняется, если рассматривать все данные в целом.

Нашла несколько медицинских примеров этого парадокса

1⃣ Исследование двух методов лечения камней в почках. Если оценивать эффективность по всем случаям, окажется, что эффективнее новый метод. А если разбить людей на две группы — с мелкими и крупными камнями, станет ясно, что эффективнее старый: с ним процент успешных случаев выше в каждой группе. Так получилось, потому что менее эффективное лечение чаще применяли к мелким камням, которые легче лечить. В итоге для нового метода набралось много пациентов с неплохими результатами — легкость случая компенсировала выбор худшей терапии.

2⃣ Смертность от коронавирусной инфекции в 2020 году в Италии оказалась выше, чем в Китае, если учитывать всех заболевших и умерших людей. Если же разделить людей по возрастным группам, выяснится, что в Италии смертность ниже — просто в этой стране чаще болели пожилые люди, у которых вероятность смерти выше сама по себе.

3⃣ Похожая штука с исследованиями вреда курения — например, процент женщин, которые курили и выжили, будет больше, чем тех, что курили и умерли, пока их не разделят на возрастные группы. Вот тогда станет видно, что внутри каждой такой группы вероятность умереть выше у курящих.

4⃣ Еще один похожий пример: эффективность вакцины от тяжелого течения COVID-19 в Израиле без разделения на возрастные группы всего 67,5%. Но если разбить вакцинированных по возрасту, то в каждой группе эффективность будет более 80%. На картинке видно, как так вышло.

5⃣ В исследовании зафиксировали, что в период с 1970 по 1975 годы в психиатрических клиниках стало меньше пациентов мужского пола. Однако если разбить мужчин на две группы — до 65 лет и старше, то выяснится, что в каждой их стало больше. Здесь эффект связан с тем, что в больницах было больше молодых мужчин и пожилых женщин, кроме того, в этот период в целом было меньше госпитализаций.

▶️ Парадокс Симпсона обычно возникает, когда при оценке данных не учитывают некий важный фактор, влияющий на результат, например, размер камней или возраст, как в примерах. Это не значит, что все данные надо разбивать на максимально большое число групп. С точки зрения статистики, чем больше таких разбивок, тем выше вероятность ложно-положительного результата. Например, можно разделить людей еще по росту или цвету глаз — и получить совсем другие, но неверные результаты. Кроме того, в группах с небольшим числом участников выше роль случайности. Из-за этого ученые при разбивке данных должны учитывать важность влияющего фактора и еще кучу всяких деталей.

#sciencewriting