Выше квартилей
2.5K subscribers
89 photos
1 video
1 file
256 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: scientometrics@hse.ru
Download Telegram
Новое в руководстве: коллекция датасетов

В рамках нашего онлайн-руководства по наукометрии начали собирать коллекцию актуальных наукометрических датасетов — общедоступных и легальных. Сотни миллионов авторов и публикаций, тематики, цитирования, аннотации, журналы, финансирование, полные тексты — всё это доступно для скачивания, обработки, исследования и интеграции.

Уже сейчас при наличии навыков работы с данными любой желающий может собрать себе из этих данных хоть в PostgreSQL, хоть в BigQuery такую карту науки, что по охвату опередит Web of Science и Scopus, а сложные аналитические запросы типа «выдай и ранжируй всех авторов статей про пингвинов вместе со всеми их метриками и ссылками на полные тексты их публикаций в открытом доступе, а также всё то же самое для всех ссылающихся на них авторов из Антарктиды» будут выполняться легко, просто и бесплатно. Конечно, после настройки и отладки. Для удобства приводим примеры данных для ключевых датасетов.

Пока собрали датасеты по публикациям, авторам и организациям, в планах — источники (журналы), тематики, каналы финансирования и полные тексты. Всегда рады советам и рекомендациям.

#руководство #новости #датасеты #открытыйдоступ #бесплатнодляавторов
Всемирный день инженерии в целях устойчивого развития

Сегодня отмечается Всемирный день инженерии. Праздник, появившийся всего несколько лет назад при содействии ЮНЕСКО, по словам организаторов призван подчеркнуть роль инженерии и инженеров сегодня и привлечь внимание к тому, какую роль технологии играют в современной жизни и устойчивом развитии (подробнее о дате можно прочитать по ссылке). Мы решили не оставаться в стороне и, следуя нашим последним рекомендациям по использованию открытых данных для проведения наукометрических исследований (безусловно, в целях устойчивого развития), обратились к набирающей популярность базе OpenAlex, чтобы выяснить, какую роль инженерные науки играют в последние годы. Используя запрос по концептам («concepts») показали, что структура публикаций в мире и России отличается незначительно, а ведущие российские организации за 2018-2023 гг. опубликовали тысячи исследований в области инженерии. С результатами нашего мини-исследования можно ознакомиться по ссылке.

#открытыйдоступ #OpenAlex
Сегодня подготовили для вас небольшую статистику по числу исследований, тематически связанных с женщинами, феминизмом и гендерным неравенством, в России и мире за последние годы (релевантные концепты OpenAlex). А всем нашим подписчицам хотим сказать: пусть формальной наукометрии в вашей жизни будет меньше, а возможностей в науке открывается все больше.

#инфографика #открытыйдоступ #исследование #женщины
Насколько Crossref может быть полезен как инструмент библиографического поиска в сфере искусства и гуманитарных наук, попробовали выяснить коллеги из Барселонского университета.

Scopus и Web of Science традиционно критикуются за ограниченность в плане отслеживания исследований в отдельных дисциплинах. Недавнее сравнение этих коммерческих продуктов с открытыми базами данных от наших коллег, показало, что в некоторых аспектах качество находящихся в свободном доступе метаданных оказывается ничуть не хуже, чем метаданные Scopus/WoS. Авторы рассматриваемого нами сегодня исследования попытались пойти дальше и провести схожий анализ в сфере искусства и гуманитарных наук. Ключевая идея работы связана с поиском ответа на вопрос, помогает ли охват CrossRef (данные А.В. Лутая и Е.Э. Любушко на общем массиве были не во всех случаях в пользу данного продукта) отслеживать литературу по искусству и гуманитарным наукам, учитывая, что в этих областях как правило присутствует национальная и региональная направленность и ориентация на внутреннюю аудиторию?

Чтобы ответить на этот вопрос, авторы проанализировали охваты журналов в ERIH PLUS (European Reference Index for the Humanities), который содержит библиографическую информацию об академических журналах в области социальных и гуманитарных наук. На момент сбора данных, февраль 2022 года, в ERIH PLUS было включено 10 213 журналов. И также создали выборку статей по искусству и гуманитарным наукам, опубликованных в 2020 году, чтобы определить, в какой степени метаданные присутствуют в отдельных случаях (подробнее о выборке в препринте).

Что получили в итоге:

• В Scopus было проиндексировано 49% журналов, перечисленных в ERIH PLUS, а Crossref — 80%. Scopus представил широкий охват журналов, опубликованных в Северной Америке (86% журналов, перечисленных в ERIH PLUS), Океании (86%), Северной Европе (85%) и Западной Европе (74%). Crossref, как и Scopus, охватывает журналы ERIH PLUS, опубликованные в Северной Америке (94%), Северной Европе (94%), Океании (88%) и Западной Европе (86%). Охват также был широк для Азии (80%), Латинской Америки и Карибского бассейна (76%) и Восточной Европы (73%). Регионами с наименьшим охватом были Южная Европа (66%) и Африка (56%), хотя в обоих случаях охват был выше, чем у Scopus.

• Что касается метаданных, то журналы, издаваемые в Латинской Америке и Карибском бассейне (86%), Южной Европе (83%) и Восточной Европе (75%), чаще всего размещали аннотации к своим статьям. Издатели из Северной Европы чаще всего депонировали ORCID (78%) и аффилиации (67%), в то время как издатели из Латинской Америки и Карибского бассейна, как правило, депонировали ORCID (77%), но не аффилиации (11%). Информацию о финансировании чаще всего депонировали журналы, издаваемые в Северной Европе (62%) и, в меньшей степени, в Северной Америке (51%).

• Большинство статей по искусству и гуманитарным наукам, проиндексированных в Scopus в 2020 году, были также представлены в Crossref, причем охват варьировался от 86% для статей на польском языке до 99% для статей на английском языке, который был самым распространенным языком в выборке. Единственным крупным исключением были статьи на итальянском языке: лишь четверть (27%) статей, проиндексированных в Scopus, были представлены в Crossref. Большинство статей на португальском (81%), испанском (71%) и польском (68%) имели аннотацию, тогда как для статей на английском языке этот процент снизился до 31%. Напротив, 88% статей на английском и 45% статей на португальском языке включали ссылки. 35% статей на английском языке включали информацию о финансировании, но на других языках эта информация появлялась очень редко.

Это исследование показывает, что Crossref индексирует больше источников, чем Scopus, и включает дополнительные журналы из Восточной и Южной Европы и Глобального Юга. Crossref представляет собой перспективный инструмент библиографического поиска в области искусств и гуманитарных наук, но нуждается в улучшении в отношении уровня заполнения метаданных.

#обзор #журналы #crossref #открытыйдоступ
Сегодня, во всемирный день поэзии, предлагаем вам взглянуть на то, как обстоят дела с научными публикациями, тематически связанными с данной областью, на массиве данных OpenAlex. Рассматриваем работы за последние 10 лет (с 1 января 2013 года), у которых в списке тематик был тэг «Poetry». Таких публикаций оказалось чуть больше 200 тысяч.

Отфильтровав работы по типу публикации «journal article» и по уровню связи с тематикой, сократили их общее количество до 70 тысяч публикаций. Заметим, что следующий фильтр (по наличию хотя бы одной аффилиации) сократил список до 18 тысяч, что, на наш взгляд, демонстрирует ограниченность метаданных по аффилиациям в текущей конфигурации OpenAlex.

После итогового сведения результатов и удаления дубликатов, мы получили 1255 образовательных организаций, имеющих хотя бы одну публикацию по поэзии. Среди них у 953 есть совместная работа с другим вузом (внутриуниверситетские коллаборации не учитывались). Их можно легко визуализировать, нажав на пункт «Связи» в легенде.

Также исследовались отдельные концепты, относящиеся к различным поэтическим группам: американской, арабской, английской, латинской, русской, китайской (отдельно — классической китайской) поэзиям. Несмотря на отсутствие прямого концепта «русская поэзия» в OpenAlex, нам удалось его сформировать на основе пересечений массивов публикаций по тематикам «Poetry» и «Russian literature». Отметим, что уход на данный уровень анализа ясно показывает несовершенство автоматически формируемых тематик более низкого порядка (например, английскую поэзию в Великобритании при использованном нами подходе «не изучают»), но определенный потенциал (особенно при расширении числа метаданных) он все же имеет. Чтобы выделить конкретный концепт, дважды кликните по его названию в легенде диаграммы.

#OpenAlex #открытыйдоступ #инфографика
Ученые в Твиттере: открытые данные

Сегодня мы к вам снова с постом про открытые данные, на этот раз нашли любопытное исследование о представленности ученых в Twitter.

В препринте представлен новый и простой подход для сопоставления авторов из OpenAlex с пользователями Twitter, идентифицированными в Crossref Event Data. OpenAlex или Crossref Event Data дают возможность определить ученых в социальных сетях, используя только открытые данные. Подход, заявленный в исследовании, позволяет сопоставить около 500 000 ученых с их аккаунтами в Twitter с высокой точностью.

Социальные медиа очень важны для взаимодействия между академическим и неакадемическим миром. Исследователи, предположительно, чаще публикуют в Twitter научные публикации, чем «неисследователи». Коллеги собрали для своей выборки ученых в Twitter, которые твитнули (хотя бы один раз) одну из своих публикаций (записанных в Crossref Event Data). Причем брали как исследователей, которые самостоятельно указали Twitter в своем профиле ORCID, так и сопоставляли аккаунты Twitter и авторов в OpenAlex по комбинации из фамилии, инициалов, первого имени, профессиональных титулов (Dr., Ph.D., MD).

Авторы использовали дамп данных Crossref Event Data за январь 2022 года, содержащий более 60 миллионов твитов от 5 288 867 уникальных аккаунтов Twitter, которые содержат DOI статей, упомянутых в этом твите. Эта база включает 4,7 миллиона уникальных DOI.

Среди представленных в Twitter ученых большинство из них публиковали ссылки на статьи, связанные с медициной, биологией, психологией, в меньшинстве были философия, математика и инженерия. По представленности среди стран лидируют англоязычные ученые (США, Великобритания, Австралия, Канада).

Набор данных открыт и может помочь взаимодействию ученых в Twitter.

#обзор #открытыйдоступ #OpenAlex #crossref #twitter
Новое в руководстве: датасеты источников

Добавили новый подраздел в онлайн-руководство. Он посвящен датасетам источников: спискам и каталогам журналов, конференций, репозиториев — естественно, общедоступным.

Собрали ссылки и краткие описания каталогов DOAJ (с примером данных из общедоступной выгрузки), OpenAlex, списков на основе Scopus, базы журналов Российского центра научной информации, основных экспертных списков журналов и конференций, каталогов репозиториев датасетов и препринтов.

Также обновляем и расширяем все остальные разделы руководства, уделяя особое внимание базам, доступным в России.

#новости #руководство #открытыйдоступ
Всемирный день искусства сквозь призму наукометрии и креативной карьеры

Архитектура, кинематограф, танец, изобразительное искусство, литература, музыка, фотография, театр — на все эти направления искусства мы сегодня решили взглянуть с помощью наукометрии. Мы проанализировали статьи из базы данных OpenAlex, которым был присвоен хотя бы один concept из специально составленных по каждой тематике списков. Количество статей варьировалось от 7600 (по архитектуре) до 175000 (по литературе). В общей сложности под результат запроса попали 412000 статей.

Мы также использовали аннотации к статьям, чтобы определить, какие словосочетания встречаются в статьях чаще других. В аннотациях мы выделили ряд биграмм и 1000 наиболее часто встречающихся по каждой тематике изобразили на картинках к посту.

Говоря об исследованиях в области искусства, нельзя не затронуть вопрос о том, как ученому и художнику представить свои достижения. На прошлой неделе прошел круглый стол «Помогающие инициативы для развития креативной карьеры», с материалами которого рекомендуем вам ознакомиться. К дискуссии были приглашены представители «помогающих инициатив», которые работают с карьерным развитием в сложных сегментах — художественном (искусство, литература, хореография) и научном.

Круглый стол прошел в рамках конференции «Теории и практики искусства и дизайна: социокультурные, экономические и политические контексты», ассоциированном мероприятии XXIV Ясинской конференции.

#OpenAlex #открытыйдоступ #инфографика
​​Новое в руководстве: раздел про OpenAlex

В онлайн-руководство добавлен раздел про OpenAlex — новую, свободную и открытую базу метаданных, за пару лет ставшую очень популярной. Это получилось за счет опоры на данные закрытого в прошлом году Microsoft Academic, творчески пополняемые и интегрируемые из десятка других источников. OpenAlex уже используется и в академической наукометрии, и как основа для новых научных поисковиков и других сервисов (Litmaps, Inciteful и т.д.).

Для России после отключения Web of Science и Scopus эта база наряду с Semantic Scholar, Lens и Dimensions стала особенно актуальна. Ее отличают бесплатность и максимально свободная лицензия, хороший и подробно документированный API. При этом по ряду аспектов она пока существенно отстает от классических баз, на что мы обращаем особое внимание.

#руководство #OpenAlex #открытыйдоступ
​​«Ночь музеев» в фокусе наукометрии

Ни для кого не секрет, что музеи и другие культурные объекты принимают активное участие в научно-исследовательской деятельности. На их базе изучаются археологические находки, памятники природы, предметы искусства, особенности геологии, культуры и истории различных регионов. В преддверии «Ночи музеев» мы подготовили информацию о научной активности пятнадцати российских музеев, галерей и национальных парков, профили которых есть в OpenAlex.

🏺Всего в базе OpenAlex было найдено 1057 статей, принадлежащих 568 авторам. Выделили 144 тематики различных уровней, по каждой из которых было не менее 3 публикаций.
🏺Больше всего в базе публикаций с аффилиацией Музея антропологии и этнографии (Кунсткамеры) в Санкт-Петербурге (702). За ним следует Государственный Эрмитаж (656) и Геологический музей им. Вернадского (340).
🏺Топ-3 тематики по числу публикаций для музеев — археология, геология и география. На четвертом месте искусство, далее радиоуглеродное датирование и другие узкопроофильные темы.
🏺Для национальных парков наиболее популярные темы — экология, экосистемы и изменение климата.

На диаграмме представлены наиболее популярные тематики и количество статей в них по каждой из рассмотренных организаций. Повышение качества метаданных в открытых базах данных позволит в будущем детальнее смотреть на профили музеев в разрезе наукометрии.

#открытыйдоступ #OpenAlex #музеи
​​Общероссийский день библиотек

Сегодня отмечается Общероссийский день библиотек. В этот день в 1795 году была основана Императорская публичная библиотека (сегодня — Российская национальная библиотека). Объем фонда этой библиотеки с тех пор вырос с 300 тысяч до 40 миллионов экземпляров. Что можно сказать о российских библиотеках сегодня?

По данным Министерства культуры в России на конец 2022 года насчитывалось 40906 библиотек с общим фондом хранения более 800 миллионов документов. Российская государственная библиотека с 48 млн документов занимает 5 место в мире по объему библиотечного фонда, а упоминавшаяся выше Российская национальная библиотека — 7 место.

Специалисты по библиотечному делу работают сегодня с каталогами, базами данных и автоматизированными библиотечно-информационными системами, которые отслеживают приобретение и обращение фондов и периодики. Всего таких систем порядка 16, причем одни из самых популярных (Alma, Aleph, Virtua и др.) принадлежат дочерним подразделениям компании Clarivate, оператору Web of Science. В России, наравне с Virtua, распространены национальные системы ИРБИС, РУСЛАН, а также внутренние разработки некоторых библиотек.

Сами по себе исследования в области библиотечно-информационного дела хотя и не являются ведущим направлением научной работы, все же производятся на базе библиотек и профильных учебных заведений. Исследуются, например, функции библиотек в наукометрии, особенности локальной библиографии, история и направления развития библиотек. На графике приведены наиболее активные организации, публикующие работы в области библиотечно-информационного дела, и количество их статей по этой теме, индексируемых в открытой базе OpenAlex.

#открытыйдоступ #OpenAlex #библиотеки
День русского языка: Пушкин в научных статьях

Сегодня, в День русского языка, в Вышке будут объявлены победители Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ. В этом году конкурс проводится уже в третий раз, в нем представлено 259 работ по двум номинациям: научной и научно-популярной.

Учреждение Дня русского языка приурочено ко дню рождения великого русского поэта Александра Сергеевича Пушкина, отмечаемого ежегодного 6 июня. Чтобы проследить влияние поэта на исследователей и их работы, мы проанализировали статьи из базы данных OpenAlex, у которых в заголовке присутствует слово «Пушкин». Всего таких статей было 1806. Из аннотаций к ним, переведенным на русский язык, составили облако слов. Самыми часто встречающимися словами были названия его произведений: Евгений Онегин, Борис Годунов, Медный всадник, а также другие русские писатели и поэты, на многих из которых творчество Александра Сергеевича оказало непосредственное влияние, — Анна Ахматова, Борис Пастернак, Владимир Набоков, Иосиф Бродский. Конечно, встречается и профессиональная лексика таких областей, как культурология и филология: культурный код, интертекстуальный анализ, критический прием. Интересно, что среди слов-ассоциаций выделяются также дополненная реальность и итальянское кино.

#вышка #инфографика #открытыйдоступ #OpenAlex #Пушкин
Сегодня международный день архивов, значит, самое время рассказать о базе публикаций от команды, возможно, главного из них — Internet Archive.

Проект FATCAT в полной мере отражает суть архивной деятельности — сохранение знания на все времена, в данном случае — знания о публикациях. Для нас с вами важен еще и второй принцип Internet Archive, распространяющийся на FATCAT — сделать все знания человечества доступными всем жителям Земли, разумеется, бесплатно.

FATCAT — открытая база метаданных научных публикаций наподобие OpenAlex, но с важными отличиями: каждая публикация (work) представлена всеми версиями, которые называются релизами (release). Остальные сущности — container (например, журнал или сервер препринтов), creator (автор, редактор, переводчик), file set (датасеты и сопроводительные материалы) и т.д., организаций, издателей, грантов среди них нет. Также система хранит в Internet Archive полные тексты публикаций, где это позволяется лицензией, и призывает всех пользователей указывать ссылки на полные тексты/данные для вечного хранения.

Вот как это выглядит на примере статьи одного из авторов нашего канала.

Конечно, система пока не может обеспечить качество авторских профилей, сопоставимое с коммерческими базами, учет цитирований там тоже в стадии становления, но совокупный объем данных, уже сохраненных в проекте, огромен: 131 миллион works, из которых 38 миллионов доступны в полном тексте, данные о 195 тысячах журналов и других изданий и многое другое. Все это собирается и обогащается из CrossRef, PubMed Central, CORE, Wikidata, ORCID, DOAJ, Норвежского списка журналов и других компонентов глобальной инфраструктуры открытой науки.

FATCAT имеет руководство и полноценный общедоступный API, отметим, порог входа там повыше, чем у CrossRef и OpenAlex, но сам доступ совершенно открыт, поэтому система активно используется множеством сторонних проектов. Идентификаторы FATCAT интегрированы во множество проектов в рамках открытой науки, в том числе в белый список журналов Российского центра научной информации.

Несмотря на скудные возможности некоммерческой команды, проект быстро развивается. Так, на его основе появился сервис, который многим будет интереснее, чем API и метаданные:
Internet Archive Scholar, реализующий полнотекстовой (sic!) поиск по 25 миллионам публикаций начиная с XVIII века.

#архив #открытыйдоступ
Факторы, влияющие на публикацию в открытом доступе: на примере Springer Nature

Мы уже писали о проблеме перехода к открытому доступу (OA) и связанной с ним плате за обработку статей (APC). Многие авторы не могут позволить себе оплатить эти взносы. Таким образом ОА может скорее усугублять существующее неравенство в системе публикаций, чем преодолевать его. Коллеги провели исследование и изучили 522 411 статей, опубликованных в издательстве Springer Nature, чтобы выявить взаимосвязь между авторами, принадлежащими к странам с разным уровнем дохода, их выбором модели публикации и влиянием их статей на цитируемость. Была обнаружена сильная корреляция между уровнем журнала и моделью публикации в золотых ОА-журналах, в то время как в гибридных журналах ОА-вариант в основном отсутствует. Также положительная корреляция между цитированием и публикацией в открытом доступе в 1,3 раза слабее в странах с высоким уровнем дохода, чем в других странах.

Результаты исследования показывают, что:

• авторы, имеющие право на освобождение от платы за обработку статей (APC), публикуются в золотых ОА-журналах чаще, чем другие,
• авторы, имеющие право на скидку APC, имеют наименьший коэффициент публикаций в ОА-журналах (что позволяет предположить, что данная скидка недостаточно мотивирует авторов публиковаться в золотых ОА-журналах),
• наиболее значимыми факторами при выборе модели OA являются уровень дохода в стране, трудовой стаж и опыт OA-публикаций, пол автора оказывает наименьшее влияние.

#обзор #открытыйдоступ #apc #scopus
О туризме в наукометрическом разрезе

Пока многие читатели "Выше квартилей" находятся в отпуске или готовятся к нему, мы решили поинтересоваться, как тема отдыха и путешествий освещается в научном мире.

Исследовались статьи базы OpenAlex, для которых указана тема "tourism" в 2018-2023 гг.

Вот некоторые результаты нашего анализа:

• В абсолютных значениях лидером оказались Индонезия и Китай, за ними следуют США и Великобритания.
• В относительных же величинах несмотря на общее небольшое количество публикаций лидируют небольшие курортные страны: Фиджи, Аруба, Багамы, Барбадос. У этих стран более 3% публикаций посвящено сфере туризма и гостеприимства. Более 2% - у Гайаны, Андорры, Маврикия, Французской Полинезии, Мальдив, Черногории, а у Ямайки и Кипра - более 1,5%.
• Нужно отметить, что эти величины тесно связаны с доходами стран от туризма (согласно данным UNWTO).

P.S. Картинка ученого-наукометриста в летнем отпуске сгенерирована Kandinsky 2.2 by Sber AI

#OpenAlex #открытыйдоступ #инфографика
Scientometrio в День эсперанто

Сегодня отмечается День эсперанто. В этот день в 1887 году Людвиг Заменгоф опубликовал учебник по одному из наиболее известных в мире искусственных международных языков, на активное развитие и использование которого возлагал большие надежды (название языка «эсперанто» отсылает к слову «надежда» и использовался самим Заменгофом в качестве псевдонима).

В основе эсперанто — романо-германские корни, есть заимствования из славянских языков, при этом грамматика максимально упрощена. За счет этого эсперанто значительно облегчает изучение других языков.

Сейчас языком эсперанто владеет по разным оценкам от ста тысяч до двух миллионов человек. Все­об­щая ас­со­циа­ция эс­пе­ран­то насчитывает порядка 14 тысяч членов.

С точки зрения наукометрии эсперанто вряд ли можно считать объектом пристального изучения в мире: в базе OpenAlex индексируется всего лишь порядка тысячи статей и около 600 книг. Тем не менее публикации и книги выходят каждый год, и даже несмотря на повышение охвата нельзя не отметить, что со временем число публикаций постепенно увеличивается.

PS: В Scopus на данный момент индексируется 170 публикаций, для которых указан язык эсперанто, однако большинство из них на самом деле написаны на других языках — латышском и испанском. Судя по всему, в ряде случаев алгоритмы Scopus ошибочно определяют эти языки из-за максимального сходства с эсперанто.

#OpenAlex #открытыйдоступ #языки #эсперанто
https://i.ibb.co/BPQQTSd/Untitled.png
Les grands embrasements naissent de petites étincelles

На сайте Сорбонны опубликована новость о том, что ведущий университет Франции прекратил свою подписку на Web of Science, а также перестанет использовать другие библиометрические инструменты Clarivate в 2024 году. На выходных эту новость подхватили многие наши коллеги после заметки Ивана Бегтина.

Такое решение обусловлено тенденцией к переходу от проприетарных продуктов к открытым и бесплатным инструментам. Вместо WoS Сорбонна будет использовать OpenAlex, с которым университет собирается заключить партнерское соглашение. В будущем ожидается, что обе стороны возьмут на себя обязательства по сотрудничеству и улучшению качества данных, относящихся к Сорбонне.

Решение Сорбонны подпадает под общий тренд последних лет, связанный с Open Access. Так, в анонсе Сорбонны упоминается Лейденский CWTS Ranking, который также заявляет о приоритетности открытых данных, стремится к полной прозрачности и воспроизводимости своих рейтингов при помощи CrossRef и OpenAlex. Кроме того, Лейденский Университет анонсирует версию «открытого издания» своего рейтинга на базе OpenAlex в 2024 году.

Про OpenAlex в качестве потенциального конкурента библиометрических баз, доступных по подписке, довольно позитивно отзываются и другие университеты:

• Библиотеки HKU, HKUST, Сингапурского университета менеджмента и Университета Калгари публиковали обзорные статьи про OpenAlex с примерами составления API-запросов;
• О преимуществах использования OpenAlex писал университет Хьюстона;
• Лаборатория Утрехтского университета предлагает использовать данные базы в проекте FAIR data;
• Университет Милана официально ссылается на данные OpenAlex в отчетах о научно-исследовательской работе;
• Политехнический университет Каталонии (BarcelonaTech) использует данные базы в рамках мониторинга открытого доступа в каталонских университетах.

Как видно из приведенных заметок, обращение к открытым данных пока ограничивается лишь рекомендациями и инструкциями. Однако уже сейчас очевидно, что инициативу Сорбонны в перспективе могут разделить и другие ведущие университеты. Ведь большие пожары зарождаются из маленьких искр.

#анонсы #новости #открытыйдоступ #университеты #openalex
​​Олигополия журналов открытого доступа

В последние десятилетия академические библиотеки столкнулись с кризисом, связанным с увеличением стоимости на подписки журналов. Исследователи объясняют возникшую проблему олигополией нескольких ведущих коммерческих издательств, которые использовали стратегии дифференциации продуктов и ценообразования, чтобы манипулировать рынком подписок на научные журналы.

В сравнении с традиционным подходом к публикациям, модель публикаций открытого доступа позволяет издателям получать доход в процессе производства, а не в процессе продаж, что не только минимизирует производственные расходы и финансовые потери от непроданных копий, но и снижает порог входа на рынок. Несмотря на ощутимые преимущества такого подхода, малоизвестные издательства всё еще не могут конкурировать с крупными.

Так, известное издательство ничем не рискует при выпуске нового журнала, так как он будет ассоциироваться с высоким качеством и престижностью, также крупные издательства могут взимать более высокую плату за обработку публикаций за счет бренда и отсутствия фиксированных цен на рынке и предлагать гибридный открытый доступ, позволяющий получать доход от одной и той же статьи дважды (т.е. оплату за подписку и за обработку публикации).

Помимо прочего, ключевым фактором, по мнению авторов статьи, является подсчет статей, индексируемых крупномасштабными библиометрическими базами данных (охватывающим журналы коммерческих издательств), который создает сильный стимул для исследователей публиковаться именно в них (молодым исследователям это нужно для продвижения по карьерной лестнице, а состоявшимся — для подтверждения грантов) что, в свою очередь, усиливает контроль коммерческих издателей над научным сообществом.

В 2020 году на издательском рынке открытого доступа было опубликовано в общей сложности 640 169 статей, индексирующихся в Web of Science (WoS). Доход от сборов за обработку статей (APC) составил 1 254 775 669 долларов, при этом на долю восьми крупнейших издательств открытого доступа (MDPI, Springer-Nature, Elsevier, Wiley, Frontiers, PLOS, Hindawi, Taylor & Francis) пришлось почти 70,63% общего дохода, несмотря на то, что они производят всего 30,92% продукции на рынке. При этом число издателей открытого доступа резко выросло с 1368 (2008 г.) до 8442 в (2020 г.).

Сложившаяся ситуация давно вызывала волнения в научном сообществе. Так, в 2012 году кампания Сost of Knowledge, запущенная кембриджским математиком Тимоти Гауэрсом, просила исследователей протестовать против бизнес-модели Elsevier путем полного бойкотирования ее журналов. Несколько университетских библиотек, в том числе крупных и известных университетов, такие как Калифорнийский университет и Гарвард, также вели активные переговоры с крупными коммерческими издателями и грозили бойкотом. Констанцский университет просто отменил все подписки Elsevier, поскольку не мог и не хотел идти в ногу с агрессивной ценовой политикой компании (рост стоимости на подписки на 30% с 2010 по 2015 год) (Larivière, Haustein, Mongeon, 2015). На графике в статье приводится изменение средней стоимости публикации Gold OA у Elsevier и других ведущих издательств.

Таким образом, несмотря на то, что модель публикаций открытого доступа рассматривалась изначально в том числе как решение проблемы олигополии научных издательств, со временем соотношение издательств этой модели на рынке само стало напоминать олигополию.

#открытыйдоступ #webofscience #elsevier #обзор
Представляем свежий дайджест научных событий за последний месяц. Для удобства читателей мы разделили его на рубрики.

Научная политика

- Европейская организация по ядерным исследованиям (ЦЕРН) приняла решение не продлевать соглашение об участии российских научных организаций. Это означает также приостановку совместной работы не только на Большом адронном коллайдере, но и по другим крупным проектам. Срок действия этого соглашения истекает 30 ноября 2024 года.

- Академик А. Р. Хохлов пишет, что деятельность компании Pleiades, которая на протяжении 30 лет обеспечивала перевод статей из российских журналов на английский язык, а также размещение этих статей на платформе издательства Springer, с 2024 года будет осуществляться в РФ через дочернюю сербскую компанию «Pleiades Resources Beograd». Приостановка сотрудничества с Pleiades чревата прекращением индексации журналов международными базами данных.

Базы данных

- Иван Бегтин анонсировал запуск новой платформы для поиска данных — Dateno. Это поисковик, который уже содержит 10 млн наборов данных из 4900 каталогов всего мира. До конца 2024 года разработчики проекта планируют добавить открытый API и увеличить наборы данных до 30 млн.

- Компания OurResearch сообщает о получении гранта в размере $7,5 млн от благотворительного фонда Arcadia на развитие OpenAlex и создание устойчивого и полностью открытого индекса мировой исследовательской экосистемы.

- Коллеги из телеграм-канала “Научные журналы и базы данных” выпустили подробный пост о последнем обновлении Google Scholar для работы с pdf-документами.

Научная этика

- В Scolary Kitchen снова подняли тему использования ИИ в написании научных статей. Озабоченность связана с недавно обнаруженными двумя публикациями Elsevier, в которых содержались такие фразы как: «Конечно, вот возможное введение к вашей теме:…» и «Мне очень жаль, но у меня нет доступа к информации в реальном времени или к данным, касающимся конкретного пациента, поскольку я являюсь языковой моделью».

- В Science вышла статья о Фонде научной честности, который готов оказывать поддержку ученым, отстаивающим чистоту результатов исследований.

- Департамент науки Китая провёл крупную проверку отозванных научных публикаций. В статье-комментарии к событию отмечено, что проведённый аудит подтверждает растущее внимание к ретракции результатов исследований.

- В Times вышли статья и видеообзор на тему разоблачения фальсифицированных исследований рака, опубликованных ведущим ученым Колумбийского университета.

#дайджест #базыданных #новости #открытыйдоступ #OpenAlex #международноесотрудничество #искуственныйинтеллект
​​Бизнес-модели открытого доступа: еще один подход к классификации

В рамках работы по оказанию помощи некоммерческим издателям в переходе на открытый доступ (ОА) Таша Меллинз-Коэн (Tasha Mellins-Cohen), исполнительный директор COUNTER и основательница Mellins-Cohen Consulting, классифицировала категории бизнес-моделей открытого доступа. В период с 2020 г. по 2024 г. она проанализировала возникающие бизнес-модели открытого доступа и выделила четыре крупные и несколько альтернативных категорий (на рисунке изображено распределение моделей, используемых на рынке).

1. Transactional (Gold OA)
В транзакционных моделях затраты на публикации переложены на авторов исследований. Такие модели широко распространены, но связаны с двумя этическими вопросами: первый — вопрос равенства и справедливости, так как не все исследователи могут позволить оплату публикаций, и второй — вопрос влияния платы за публикацию на редакционную политику издательств и соблазн их превращения в хищнические.

2. Bundled (Read-and-Publish)
Издатели, работающие как по подписке, так и с полностью открытым доступом, предлагают учреждениям возможность оплачивать «пакет услуг». Модель основана на уже существующих платежах за подписку, при этом библиотеки или консорциумы платят за поддержание доступа по подписке к спискам журналов или книг. На оплату за чтение накладывается отдельно рассчитываемая плата за открытый доступ, обычно основанная на стандартной плате за обработку статей.

3. Cooperative
Модель, которая основана на сотрудничестве между учреждениями. Учреждения оформляют подписку традиционным способом, и когда собран доход, запланированный издателем, журнал публикуется в открытом доступе. Если финансовые затраты на выпуск журнала не покрываются, контент остается доступным по подписке.

4. Non-library funding (Diamond/Platinum OA)
Модель строится на институциональном или общественном финансировании, грантах или пожертвованиях, что позволяет издателям предлагать бесплатный открытый доступ авторам с уверенностью, что их производственные расходы будут покрыты.
Platinum/Diamond OA часто предлагается университетскими издательствами, где расходы на публикацию включены в существующие бюджеты и являются частью миссии университета.

5 и 6. Delayed (Bronze OA) and Green OA
Открытый доступ Bronze OA подразумевает предоставление доступа к контенту после истечения срока действия эмбарго. При этом издатель может прекратить доступ к статьям в любое время. Кроме того, авторы не сохраняют авторские права на свои статьи. В результате статьи открытого доступа Bronze OA обычно недоступны для загрузки или распространения.

Green OA — оригинальный путь к открытому доступу, примером которого является arXiv. Депонирование препринтов (или постпринтов) позволяет авторам делать версии своей работы до или после рецензирования доступными для публичного изучения и использования. Green OA обеспечивается несколькими способами: исследования могут быть доступны в институциональных или дисциплинарных репозиториях, а также могут быть размещены на личном сайте автора.

Примечательно, что автор выделяет отдельную категорию Pseudo-models и относит к ней проект SPA-OPS, реализуемый в рамках Plan S. SPA-OPS расширяет подход к открытому доступу (трансформирует различные возможности продуктов и лицензирования, а также системы перераспределения затрат, такие как консорциальные публикации).

Модель открытого доступа, в которой автор оплачивает публикацию и обработку статьи (APC) широко распространена среди издательств, но всё же она не является универсальным решением, и не только из-за того, что устраняет одни неравенства и множит другие. В ряде случаев издательству выгоднее применять другие бизнес-модели, опираясь на географическое разнообразие авторов, существующие институциональные и спонсорские отношения, источники финансирования, а также типы публикуемых материалов.

#открытыйдоступ #обзор