Выше квартилей
2.51K subscribers
89 photos
1 video
1 file
263 links
HSE: Home of Scientometrics and Expertise

Обучение и консультирование по практическим вопросам research evaluation и управлении наукой.

Все вопросы и предложения направляйте @vyshekbot или на почту Наукометрического центра ВШЭ: scientometrics@hse.ru
Download Telegram
Всемирный день искусства сквозь призму наукометрии и креативной карьеры

Архитектура, кинематограф, танец, изобразительное искусство, литература, музыка, фотография, театр — на все эти направления искусства мы сегодня решили взглянуть с помощью наукометрии. Мы проанализировали статьи из базы данных OpenAlex, которым был присвоен хотя бы один concept из специально составленных по каждой тематике списков. Количество статей варьировалось от 7600 (по архитектуре) до 175000 (по литературе). В общей сложности под результат запроса попали 412000 статей.

Мы также использовали аннотации к статьям, чтобы определить, какие словосочетания встречаются в статьях чаще других. В аннотациях мы выделили ряд биграмм и 1000 наиболее часто встречающихся по каждой тематике изобразили на картинках к посту.

Говоря об исследованиях в области искусства, нельзя не затронуть вопрос о том, как ученому и художнику представить свои достижения. На прошлой неделе прошел круглый стол «Помогающие инициативы для развития креативной карьеры», с материалами которого рекомендуем вам ознакомиться. К дискуссии были приглашены представители «помогающих инициатив», которые работают с карьерным развитием в сложных сегментах — художественном (искусство, литература, хореография) и научном.

Круглый стол прошел в рамках конференции «Теории и практики искусства и дизайна: социокультурные, экономические и политические контексты», ассоциированном мероприятии XXIV Ясинской конференции.

#OpenAlex #открытыйдоступ #инфографика
​​Новое в руководстве: раздел про OpenAlex

В онлайн-руководство добавлен раздел про OpenAlex — новую, свободную и открытую базу метаданных, за пару лет ставшую очень популярной. Это получилось за счет опоры на данные закрытого в прошлом году Microsoft Academic, творчески пополняемые и интегрируемые из десятка других источников. OpenAlex уже используется и в академической наукометрии, и как основа для новых научных поисковиков и других сервисов (Litmaps, Inciteful и т.д.).

Для России после отключения Web of Science и Scopus эта база наряду с Semantic Scholar, Lens и Dimensions стала особенно актуальна. Ее отличают бесплатность и максимально свободная лицензия, хороший и подробно документированный API. При этом по ряду аспектов она пока существенно отстает от классических баз, на что мы обращаем особое внимание.

#руководство #OpenAlex #открытыйдоступ
​​«Ночь музеев» в фокусе наукометрии

Ни для кого не секрет, что музеи и другие культурные объекты принимают активное участие в научно-исследовательской деятельности. На их базе изучаются археологические находки, памятники природы, предметы искусства, особенности геологии, культуры и истории различных регионов. В преддверии «Ночи музеев» мы подготовили информацию о научной активности пятнадцати российских музеев, галерей и национальных парков, профили которых есть в OpenAlex.

🏺Всего в базе OpenAlex было найдено 1057 статей, принадлежащих 568 авторам. Выделили 144 тематики различных уровней, по каждой из которых было не менее 3 публикаций.
🏺Больше всего в базе публикаций с аффилиацией Музея антропологии и этнографии (Кунсткамеры) в Санкт-Петербурге (702). За ним следует Государственный Эрмитаж (656) и Геологический музей им. Вернадского (340).
🏺Топ-3 тематики по числу публикаций для музеев — археология, геология и география. На четвертом месте искусство, далее радиоуглеродное датирование и другие узкопроофильные темы.
🏺Для национальных парков наиболее популярные темы — экология, экосистемы и изменение климата.

На диаграмме представлены наиболее популярные тематики и количество статей в них по каждой из рассмотренных организаций. Повышение качества метаданных в открытых базах данных позволит в будущем детальнее смотреть на профили музеев в разрезе наукометрии.

#открытыйдоступ #OpenAlex #музеи
​​Общероссийский день библиотек

Сегодня отмечается Общероссийский день библиотек. В этот день в 1795 году была основана Императорская публичная библиотека (сегодня — Российская национальная библиотека). Объем фонда этой библиотеки с тех пор вырос с 300 тысяч до 40 миллионов экземпляров. Что можно сказать о российских библиотеках сегодня?

По данным Министерства культуры в России на конец 2022 года насчитывалось 40906 библиотек с общим фондом хранения более 800 миллионов документов. Российская государственная библиотека с 48 млн документов занимает 5 место в мире по объему библиотечного фонда, а упоминавшаяся выше Российская национальная библиотека — 7 место.

Специалисты по библиотечному делу работают сегодня с каталогами, базами данных и автоматизированными библиотечно-информационными системами, которые отслеживают приобретение и обращение фондов и периодики. Всего таких систем порядка 16, причем одни из самых популярных (Alma, Aleph, Virtua и др.) принадлежат дочерним подразделениям компании Clarivate, оператору Web of Science. В России, наравне с Virtua, распространены национальные системы ИРБИС, РУСЛАН, а также внутренние разработки некоторых библиотек.

Сами по себе исследования в области библиотечно-информационного дела хотя и не являются ведущим направлением научной работы, все же производятся на базе библиотек и профильных учебных заведений. Исследуются, например, функции библиотек в наукометрии, особенности локальной библиографии, история и направления развития библиотек. На графике приведены наиболее активные организации, публикующие работы в области библиотечно-информационного дела, и количество их статей по этой теме, индексируемых в открытой базе OpenAlex.

#открытыйдоступ #OpenAlex #библиотеки
День русского языка: Пушкин в научных статьях

Сегодня, в День русского языка, в Вышке будут объявлены победители Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ. В этом году конкурс проводится уже в третий раз, в нем представлено 259 работ по двум номинациям: научной и научно-популярной.

Учреждение Дня русского языка приурочено ко дню рождения великого русского поэта Александра Сергеевича Пушкина, отмечаемого ежегодного 6 июня. Чтобы проследить влияние поэта на исследователей и их работы, мы проанализировали статьи из базы данных OpenAlex, у которых в заголовке присутствует слово «Пушкин». Всего таких статей было 1806. Из аннотаций к ним, переведенным на русский язык, составили облако слов. Самыми часто встречающимися словами были названия его произведений: Евгений Онегин, Борис Годунов, Медный всадник, а также другие русские писатели и поэты, на многих из которых творчество Александра Сергеевича оказало непосредственное влияние, — Анна Ахматова, Борис Пастернак, Владимир Набоков, Иосиф Бродский. Конечно, встречается и профессиональная лексика таких областей, как культурология и филология: культурный код, интертекстуальный анализ, критический прием. Интересно, что среди слов-ассоциаций выделяются также дополненная реальность и итальянское кино.

#вышка #инфографика #открытыйдоступ #OpenAlex #Пушкин
Сегодня международный день архивов, значит, самое время рассказать о базе публикаций от команды, возможно, главного из них — Internet Archive.

Проект FATCAT в полной мере отражает суть архивной деятельности — сохранение знания на все времена, в данном случае — знания о публикациях. Для нас с вами важен еще и второй принцип Internet Archive, распространяющийся на FATCAT — сделать все знания человечества доступными всем жителям Земли, разумеется, бесплатно.

FATCAT — открытая база метаданных научных публикаций наподобие OpenAlex, но с важными отличиями: каждая публикация (work) представлена всеми версиями, которые называются релизами (release). Остальные сущности — container (например, журнал или сервер препринтов), creator (автор, редактор, переводчик), file set (датасеты и сопроводительные материалы) и т.д., организаций, издателей, грантов среди них нет. Также система хранит в Internet Archive полные тексты публикаций, где это позволяется лицензией, и призывает всех пользователей указывать ссылки на полные тексты/данные для вечного хранения.

Вот как это выглядит на примере статьи одного из авторов нашего канала.

Конечно, система пока не может обеспечить качество авторских профилей, сопоставимое с коммерческими базами, учет цитирований там тоже в стадии становления, но совокупный объем данных, уже сохраненных в проекте, огромен: 131 миллион works, из которых 38 миллионов доступны в полном тексте, данные о 195 тысячах журналов и других изданий и многое другое. Все это собирается и обогащается из CrossRef, PubMed Central, CORE, Wikidata, ORCID, DOAJ, Норвежского списка журналов и других компонентов глобальной инфраструктуры открытой науки.

FATCAT имеет руководство и полноценный общедоступный API, отметим, порог входа там повыше, чем у CrossRef и OpenAlex, но сам доступ совершенно открыт, поэтому система активно используется множеством сторонних проектов. Идентификаторы FATCAT интегрированы во множество проектов в рамках открытой науки, в том числе в белый список журналов Российского центра научной информации.

Несмотря на скудные возможности некоммерческой команды, проект быстро развивается. Так, на его основе появился сервис, который многим будет интереснее, чем API и метаданные:
Internet Archive Scholar, реализующий полнотекстовой (sic!) поиск по 25 миллионам публикаций начиная с XVIII века.

#архив #открытыйдоступ
Факторы, влияющие на публикацию в открытом доступе: на примере Springer Nature

Мы уже писали о проблеме перехода к открытому доступу (OA) и связанной с ним плате за обработку статей (APC). Многие авторы не могут позволить себе оплатить эти взносы. Таким образом ОА может скорее усугублять существующее неравенство в системе публикаций, чем преодолевать его. Коллеги провели исследование и изучили 522 411 статей, опубликованных в издательстве Springer Nature, чтобы выявить взаимосвязь между авторами, принадлежащими к странам с разным уровнем дохода, их выбором модели публикации и влиянием их статей на цитируемость. Была обнаружена сильная корреляция между уровнем журнала и моделью публикации в золотых ОА-журналах, в то время как в гибридных журналах ОА-вариант в основном отсутствует. Также положительная корреляция между цитированием и публикацией в открытом доступе в 1,3 раза слабее в странах с высоким уровнем дохода, чем в других странах.

Результаты исследования показывают, что:

• авторы, имеющие право на освобождение от платы за обработку статей (APC), публикуются в золотых ОА-журналах чаще, чем другие,
• авторы, имеющие право на скидку APC, имеют наименьший коэффициент публикаций в ОА-журналах (что позволяет предположить, что данная скидка недостаточно мотивирует авторов публиковаться в золотых ОА-журналах),
• наиболее значимыми факторами при выборе модели OA являются уровень дохода в стране, трудовой стаж и опыт OA-публикаций, пол автора оказывает наименьшее влияние.

#обзор #открытыйдоступ #apc #scopus
О туризме в наукометрическом разрезе

Пока многие читатели "Выше квартилей" находятся в отпуске или готовятся к нему, мы решили поинтересоваться, как тема отдыха и путешествий освещается в научном мире.

Исследовались статьи базы OpenAlex, для которых указана тема "tourism" в 2018-2023 гг.

Вот некоторые результаты нашего анализа:

• В абсолютных значениях лидером оказались Индонезия и Китай, за ними следуют США и Великобритания.
• В относительных же величинах несмотря на общее небольшое количество публикаций лидируют небольшие курортные страны: Фиджи, Аруба, Багамы, Барбадос. У этих стран более 3% публикаций посвящено сфере туризма и гостеприимства. Более 2% - у Гайаны, Андорры, Маврикия, Французской Полинезии, Мальдив, Черногории, а у Ямайки и Кипра - более 1,5%.
• Нужно отметить, что эти величины тесно связаны с доходами стран от туризма (согласно данным UNWTO).

P.S. Картинка ученого-наукометриста в летнем отпуске сгенерирована Kandinsky 2.2 by Sber AI

#OpenAlex #открытыйдоступ #инфографика
Scientometrio в День эсперанто

Сегодня отмечается День эсперанто. В этот день в 1887 году Людвиг Заменгоф опубликовал учебник по одному из наиболее известных в мире искусственных международных языков, на активное развитие и использование которого возлагал большие надежды (название языка «эсперанто» отсылает к слову «надежда» и использовался самим Заменгофом в качестве псевдонима).

В основе эсперанто — романо-германские корни, есть заимствования из славянских языков, при этом грамматика максимально упрощена. За счет этого эсперанто значительно облегчает изучение других языков.

Сейчас языком эсперанто владеет по разным оценкам от ста тысяч до двух миллионов человек. Все­об­щая ас­со­циа­ция эс­пе­ран­то насчитывает порядка 14 тысяч членов.

С точки зрения наукометрии эсперанто вряд ли можно считать объектом пристального изучения в мире: в базе OpenAlex индексируется всего лишь порядка тысячи статей и около 600 книг. Тем не менее публикации и книги выходят каждый год, и даже несмотря на повышение охвата нельзя не отметить, что со временем число публикаций постепенно увеличивается.

PS: В Scopus на данный момент индексируется 170 публикаций, для которых указан язык эсперанто, однако большинство из них на самом деле написаны на других языках — латышском и испанском. Судя по всему, в ряде случаев алгоритмы Scopus ошибочно определяют эти языки из-за максимального сходства с эсперанто.

#OpenAlex #открытыйдоступ #языки #эсперанто
https://i.ibb.co/BPQQTSd/Untitled.png
Les grands embrasements naissent de petites étincelles

На сайте Сорбонны опубликована новость о том, что ведущий университет Франции прекратил свою подписку на Web of Science, а также перестанет использовать другие библиометрические инструменты Clarivate в 2024 году. На выходных эту новость подхватили многие наши коллеги после заметки Ивана Бегтина.

Такое решение обусловлено тенденцией к переходу от проприетарных продуктов к открытым и бесплатным инструментам. Вместо WoS Сорбонна будет использовать OpenAlex, с которым университет собирается заключить партнерское соглашение. В будущем ожидается, что обе стороны возьмут на себя обязательства по сотрудничеству и улучшению качества данных, относящихся к Сорбонне.

Решение Сорбонны подпадает под общий тренд последних лет, связанный с Open Access. Так, в анонсе Сорбонны упоминается Лейденский CWTS Ranking, который также заявляет о приоритетности открытых данных, стремится к полной прозрачности и воспроизводимости своих рейтингов при помощи CrossRef и OpenAlex. Кроме того, Лейденский Университет анонсирует версию «открытого издания» своего рейтинга на базе OpenAlex в 2024 году.

Про OpenAlex в качестве потенциального конкурента библиометрических баз, доступных по подписке, довольно позитивно отзываются и другие университеты:

• Библиотеки HKU, HKUST, Сингапурского университета менеджмента и Университета Калгари публиковали обзорные статьи про OpenAlex с примерами составления API-запросов;
• О преимуществах использования OpenAlex писал университет Хьюстона;
• Лаборатория Утрехтского университета предлагает использовать данные базы в проекте FAIR data;
• Университет Милана официально ссылается на данные OpenAlex в отчетах о научно-исследовательской работе;
• Политехнический университет Каталонии (BarcelonaTech) использует данные базы в рамках мониторинга открытого доступа в каталонских университетах.

Как видно из приведенных заметок, обращение к открытым данных пока ограничивается лишь рекомендациями и инструкциями. Однако уже сейчас очевидно, что инициативу Сорбонны в перспективе могут разделить и другие ведущие университеты. Ведь большие пожары зарождаются из маленьких искр.

#анонсы #новости #открытыйдоступ #университеты #openalex
​​Олигополия журналов открытого доступа

В последние десятилетия академические библиотеки столкнулись с кризисом, связанным с увеличением стоимости на подписки журналов. Исследователи объясняют возникшую проблему олигополией нескольких ведущих коммерческих издательств, которые использовали стратегии дифференциации продуктов и ценообразования, чтобы манипулировать рынком подписок на научные журналы.

В сравнении с традиционным подходом к публикациям, модель публикаций открытого доступа позволяет издателям получать доход в процессе производства, а не в процессе продаж, что не только минимизирует производственные расходы и финансовые потери от непроданных копий, но и снижает порог входа на рынок. Несмотря на ощутимые преимущества такого подхода, малоизвестные издательства всё еще не могут конкурировать с крупными.

Так, известное издательство ничем не рискует при выпуске нового журнала, так как он будет ассоциироваться с высоким качеством и престижностью, также крупные издательства могут взимать более высокую плату за обработку публикаций за счет бренда и отсутствия фиксированных цен на рынке и предлагать гибридный открытый доступ, позволяющий получать доход от одной и той же статьи дважды (т.е. оплату за подписку и за обработку публикации).

Помимо прочего, ключевым фактором, по мнению авторов статьи, является подсчет статей, индексируемых крупномасштабными библиометрическими базами данных (охватывающим журналы коммерческих издательств), который создает сильный стимул для исследователей публиковаться именно в них (молодым исследователям это нужно для продвижения по карьерной лестнице, а состоявшимся — для подтверждения грантов) что, в свою очередь, усиливает контроль коммерческих издателей над научным сообществом.

В 2020 году на издательском рынке открытого доступа было опубликовано в общей сложности 640 169 статей, индексирующихся в Web of Science (WoS). Доход от сборов за обработку статей (APC) составил 1 254 775 669 долларов, при этом на долю восьми крупнейших издательств открытого доступа (MDPI, Springer-Nature, Elsevier, Wiley, Frontiers, PLOS, Hindawi, Taylor & Francis) пришлось почти 70,63% общего дохода, несмотря на то, что они производят всего 30,92% продукции на рынке. При этом число издателей открытого доступа резко выросло с 1368 (2008 г.) до 8442 в (2020 г.).

Сложившаяся ситуация давно вызывала волнения в научном сообществе. Так, в 2012 году кампания Сost of Knowledge, запущенная кембриджским математиком Тимоти Гауэрсом, просила исследователей протестовать против бизнес-модели Elsevier путем полного бойкотирования ее журналов. Несколько университетских библиотек, в том числе крупных и известных университетов, такие как Калифорнийский университет и Гарвард, также вели активные переговоры с крупными коммерческими издателями и грозили бойкотом. Констанцский университет просто отменил все подписки Elsevier, поскольку не мог и не хотел идти в ногу с агрессивной ценовой политикой компании (рост стоимости на подписки на 30% с 2010 по 2015 год) (Larivière, Haustein, Mongeon, 2015). На графике в статье приводится изменение средней стоимости публикации Gold OA у Elsevier и других ведущих издательств.

Таким образом, несмотря на то, что модель публикаций открытого доступа рассматривалась изначально в том числе как решение проблемы олигополии научных издательств, со временем соотношение издательств этой модели на рынке само стало напоминать олигополию.

#открытыйдоступ #webofscience #elsevier #обзор
Представляем свежий дайджест научных событий за последний месяц. Для удобства читателей мы разделили его на рубрики.

Научная политика

- Европейская организация по ядерным исследованиям (ЦЕРН) приняла решение не продлевать соглашение об участии российских научных организаций. Это означает также приостановку совместной работы не только на Большом адронном коллайдере, но и по другим крупным проектам. Срок действия этого соглашения истекает 30 ноября 2024 года.

- Академик А. Р. Хохлов пишет, что деятельность компании Pleiades, которая на протяжении 30 лет обеспечивала перевод статей из российских журналов на английский язык, а также размещение этих статей на платформе издательства Springer, с 2024 года будет осуществляться в РФ через дочернюю сербскую компанию «Pleiades Resources Beograd». Приостановка сотрудничества с Pleiades чревата прекращением индексации журналов международными базами данных.

Базы данных

- Иван Бегтин анонсировал запуск новой платформы для поиска данных — Dateno. Это поисковик, который уже содержит 10 млн наборов данных из 4900 каталогов всего мира. До конца 2024 года разработчики проекта планируют добавить открытый API и увеличить наборы данных до 30 млн.

- Компания OurResearch сообщает о получении гранта в размере $7,5 млн от благотворительного фонда Arcadia на развитие OpenAlex и создание устойчивого и полностью открытого индекса мировой исследовательской экосистемы.

- Коллеги из телеграм-канала “Научные журналы и базы данных” выпустили подробный пост о последнем обновлении Google Scholar для работы с pdf-документами.

Научная этика

- В Scolary Kitchen снова подняли тему использования ИИ в написании научных статей. Озабоченность связана с недавно обнаруженными двумя публикациями Elsevier, в которых содержались такие фразы как: «Конечно, вот возможное введение к вашей теме:…» и «Мне очень жаль, но у меня нет доступа к информации в реальном времени или к данным, касающимся конкретного пациента, поскольку я являюсь языковой моделью».

- В Science вышла статья о Фонде научной честности, который готов оказывать поддержку ученым, отстаивающим чистоту результатов исследований.

- Департамент науки Китая провёл крупную проверку отозванных научных публикаций. В статье-комментарии к событию отмечено, что проведённый аудит подтверждает растущее внимание к ретракции результатов исследований.

- В Times вышли статья и видеообзор на тему разоблачения фальсифицированных исследований рака, опубликованных ведущим ученым Колумбийского университета.

#дайджест #базыданных #новости #открытыйдоступ #OpenAlex #международноесотрудничество #искуственныйинтеллект
​​Бизнес-модели открытого доступа: еще один подход к классификации

В рамках работы по оказанию помощи некоммерческим издателям в переходе на открытый доступ (ОА) Таша Меллинз-Коэн (Tasha Mellins-Cohen), исполнительный директор COUNTER и основательница Mellins-Cohen Consulting, классифицировала категории бизнес-моделей открытого доступа. В период с 2020 г. по 2024 г. она проанализировала возникающие бизнес-модели открытого доступа и выделила четыре крупные и несколько альтернативных категорий (на рисунке изображено распределение моделей, используемых на рынке).

1. Transactional (Gold OA)
В транзакционных моделях затраты на публикации переложены на авторов исследований. Такие модели широко распространены, но связаны с двумя этическими вопросами: первый — вопрос равенства и справедливости, так как не все исследователи могут позволить оплату публикаций, и второй — вопрос влияния платы за публикацию на редакционную политику издательств и соблазн их превращения в хищнические.

2. Bundled (Read-and-Publish)
Издатели, работающие как по подписке, так и с полностью открытым доступом, предлагают учреждениям возможность оплачивать «пакет услуг». Модель основана на уже существующих платежах за подписку, при этом библиотеки или консорциумы платят за поддержание доступа по подписке к спискам журналов или книг. На оплату за чтение накладывается отдельно рассчитываемая плата за открытый доступ, обычно основанная на стандартной плате за обработку статей.

3. Cooperative
Модель, которая основана на сотрудничестве между учреждениями. Учреждения оформляют подписку традиционным способом, и когда собран доход, запланированный издателем, журнал публикуется в открытом доступе. Если финансовые затраты на выпуск журнала не покрываются, контент остается доступным по подписке.

4. Non-library funding (Diamond/Platinum OA)
Модель строится на институциональном или общественном финансировании, грантах или пожертвованиях, что позволяет издателям предлагать бесплатный открытый доступ авторам с уверенностью, что их производственные расходы будут покрыты.
Platinum/Diamond OA часто предлагается университетскими издательствами, где расходы на публикацию включены в существующие бюджеты и являются частью миссии университета.

5 и 6. Delayed (Bronze OA) and Green OA
Открытый доступ Bronze OA подразумевает предоставление доступа к контенту после истечения срока действия эмбарго. При этом издатель может прекратить доступ к статьям в любое время. Кроме того, авторы не сохраняют авторские права на свои статьи. В результате статьи открытого доступа Bronze OA обычно недоступны для загрузки или распространения.

Green OA — оригинальный путь к открытому доступу, примером которого является arXiv. Депонирование препринтов (или постпринтов) позволяет авторам делать версии своей работы до или после рецензирования доступными для публичного изучения и использования. Green OA обеспечивается несколькими способами: исследования могут быть доступны в институциональных или дисциплинарных репозиториях, а также могут быть размещены на личном сайте автора.

Примечательно, что автор выделяет отдельную категорию Pseudo-models и относит к ней проект SPA-OPS, реализуемый в рамках Plan S. SPA-OPS расширяет подход к открытому доступу (трансформирует различные возможности продуктов и лицензирования, а также системы перераспределения затрат, такие как консорциальные публикации).

Модель открытого доступа, в которой автор оплачивает публикацию и обработку статьи (APC) широко распространена среди издательств, но всё же она не является универсальным решением, и не только из-за того, что устраняет одни неравенства и множит другие. В ряде случаев издательству выгоднее применять другие бизнес-модели, опираясь на географическое разнообразие авторов, существующие институциональные и спонсорские отношения, источники финансирования, а также типы публикуемых материалов.

#открытыйдоступ #обзор