Рабочая группа оцифровки литературных данных

В прошлом, для того чтобы находка грибов увидела свет, ее нужно было опубликовать в научной литературе (частично это правда и сейчас). Однако, единственным форматом публикации находок были аналоговые источники (публикация в журналах, которые печатались на бумаге). Потом разрозненные находки видов обобщались и суммировались в аннотированных чеклистах, флорах и подобных изданиях. Однако и они имеют физический носитель, где информация так или иначе организована в виде параграфов.

Совсем недавно стали появляться журналы, которые принимают электронные приложения с таблицами находок. И наконец, прорывом в последнее время стали глобальные порталы о биоразнообразии (например GBIF.org), где информация о находках хранится в открытых базах данных, легко обнаружима и доступна для поиска и использования глобально.

Данные находок грибов и миксомицетов в GBIF на территории Западной Сибири (открывается фильтр в GBIF)

Многие научные журналы в настоящее время имеют требование о публикации исходных данных в GBIF, что делает находки видов общедоступными для последующей научной работы на момент публикации статьи. Однако, опубликованные в прошлом работы остаются не отраженными в этом пуле общедоступных данных, пока не будут специально экстрагированы из аналоговых источников и опубликованы в виде наборов данных. В направлении оцифровки исторической литературы о биоразнообразии работает ряд международных проектов (в том числе Plazi.org, Biodiversity Heritage Library и др.). Однако актуальной остается инициатива более узких проектов озаботиться оцифровкой данных в пределах определенной таксономической группы или региона.

Задача оцифровки находок грибов, опубликованных в литературе в прошлом, и публикация их в едином ресурсе (GBIF) стоит перед рабочей группой по оцифровке литературных данных СибМикО. Работа в этом направлении началась в 2018 году с интеграции данных о литературных находках на Севере Западной Сибири. В настоящее время мы двигаемся на юг для мобилизации данных южных регионов.

В состав рабочей группы входят микологи, работающие на этой территории и заинтересованные в современных информационных технологиях в области биоразнообразия:

  • Агеев Д.В.
  • Арефьев С.П.
  • Большаков С.Ю.
  • Бульонкова Т.М.
  • Вайшля О.Б.
  • Власенко А.В.
  • Власенко В.А.
  • Гашков С.И.
  • Горбунова И.А.
  • Давыдов Е.А.

  • Звягина Е.А.
  • Капитонов В.А.
  • Кудашова Н.Н.
  • Макарова Т.А.
  • Мухин В.А.
  • Пауков А.Г.
  • Рябицева Н.Ю.
  • Седельникова Н.В.
  • Ставишенко И.В.

  • Толпышева Т.Ю.
  • Томошевич М.А.
  • Филиппова Н.В.
  • Филиппова А.В.
  • Шабанова Н.
  • Ширяев А.Г.
  • Яковченко Л.С.

Оцифровка литературных находок идет по следующему алгоритму (подробнее см. описание алгоритма в файле (pdf):

  1. Создание сети сотрудничества. В одиночку этот проект невозможно выполнить из-за большого объема литературы и данных. Поэтому мы контактируем со всеми работающими микологами и приглашаем всех к совместной работе над мобилизацией данных по определенным группам и регионам.
  2. Создание полного библиографического списка потенциальных источников находок видов. Мы составляем список всех опубликованных источников (включая материалы конференций и диссертации) по авторам и регионам. Поиск источников идет из личных архивов ученых и картотек библиотек, по основным микологическим журналам, флорам и т.д. Библиография оформляется в виде базы данных в менеджере Zoterо (для этого создан онлайн аккаунт зотеро). Каждый источник по возможности дополняется полным текстом публикации. Этот архив становится библиотекой СибМикО на будущее и может использоваться в различных направлениях.
  3. Экстрагирование находок видов из публикаций в базу данных формата GBIF. В последней содержится вся информация о находках видов, разбитая на колонки что, где, когда опубликовано + ссылка на библиографический источник. Координата, если не была указана в источнике, определяется по географическому описанию.
  4. Наконец, интегрированные данные загружаются в GBIF в виде набора данных. По желанию, описание методики работы, самого набора данных и истории изучения можно оформить в виде статьи формата Data Paper.
  5. См. также видео-инструкции о выполнении проекта: часть 1, часть 2.
  6. ШАБЛОН для ввода данных с примерами (скачать файл .xlsx)
  7. ССЫЛКА НА БАЗУ МЕТАДАННЫХ для регистрации введенных статей (ссылка на гугл-таблицу)
  8. Видео-презентация о проекте оцифровки и результатах на 25 июля 2021: ссылка на видео

Статья о литературной базе находок грибов на Севере Западной Сибири:

Filippova N, Arefyev S, Zvyagina E, Kapitonov V, Makarova T, Mukhin V, Sedelnikova N, Stavishenko I, Shiryaev A, Tolpysheva T, Ryabitseva N, Paukov A (2020) Fungal literature records database of the Northern West Siberia (Russia). Biodiversity Data Journal 8: e52963. https://doi.org/10.3897/BDJ.8.e52963


Набор данных по Северу Западной Сибири (в границах бывшей Тюменской области):

Filippova N, Arefyev S, Bulyonkova T, Zvyagina E, Kapitonov V, Makarova T, Mukhin V, Stavishenko I, Tavshanzhi E, Shiryaev A, Tolpysheva T, Sedelnikova N, Ryabitseva N, Paukov A, Zhurbenko M (2020). Fungal literature records database of the Northern West Siberia (Russia). Version 1.9. Yugra State University Biological Collection (YSU BC). Occurrence dataset https://doi.org/10.15468/hfje3l accessed via GBIF.org on 2020-03-16.


Набор данных по Югу Западной Сибири (восемь административных регионов):

Filippova N, Ageev D, Bolshakov S, Vayshlya O, Vlasenko A, Vlasenko V, Gashkov S, Gorbunova I, Davydov E, Zvyagina E, Kudashova N, Tomoshevich M, Filippova A, Shabanova N, Yakovchenko L (2021). Fungal literature records database of the Southern West Siberia (Russia). Yugra State University Biological Collection (YSU BC). Metadata dataset https://doi.org/10.15468/eqx72v accessed via GBIF.org on 2021-06-15.


Библиография микологических исследований в Западной Сибири (список из более 1300 работ на 15.06.2021) (pdf)


Аккаунт в Zotero с библиотекой микологических публикаций по Западной Сибири (на 15.06.2021) https://www.zotero.org/funws/library (для доступа в библиотеку запросите логин и пароль у Филипповой Н.В.)