Рабочая группа оцифровки литературных данных

В прошлом, для того чтобы находка грибов увидела свет, ее нужно было опубликовать в научной литературе (частично это правда и сейчас). Однако, единственным форматом публикации находок были аналоговые источники (публикация в журналах, которые печатались на бумаге). Потом разрозненные находки видов обобщались и суммировались в аннотированных чеклистах, флорах и подобных изданиях. Однако и они имеют физический носитель, где информация так или иначе организована в виде параграфов.

Совсем недавно стали появляться журналы, которые принимают электронные приложения с таблицами находок. И наконец, прорывом в последнее время стали глобальные порталы о биоразнообразии (например GBIF.org), где информация о находках хранится в открытых базах данных, легко обнаружима и доступна для поиска и использования глобально.

Данные находок грибов и миксомицетов в GBIF на территории Западной Сибири (открывается фильтр в GBIF)

Многие научные журналы в настоящее время имеют требование о публикации исходных данных в GBIF, что делает находки видов общедоступными для последующей научной работы на момент публикации статьи. Однако, опубликованные в прошлом работы остаются не отраженными в этом пуле общедоступных данных, пока не будут специально экстрагированы из аналоговых источников и опубликованы в виде наборов данных. В направлении оцифровки исторической литературы о биоразнообразии работает ряд международных проектов (в том числе Plazi.org, Biodiversity Heritage Library и др.). Однако актуальной остается инициатива более узких проектов по оцифровке данных в пределах определенной таксономической группы или региона.

Видео-инструкция для участников проекта (записана в рамках курса волонтеров ЮГУ, но актуальная для всех начинающих работу участников)

Ссылка на рабочую папку участников проекта

СПРАВОЧНЫЕ МАТЕРИАЛЫ

  1. См. также ранние видео-инструкции о выполнении проекта: часть 1, часть 2.
  2. ШАБЛОН для ввода данных с примерами
    1. Расширенный шаблон (скачать файл .xlsx)
    2. Упрощенный шаблон (скачать файл .xlsx)
  3. ССЫЛКА НА БАЗУ МЕТАДАННЫХ для регистрации введенных статей (ссылка на гугл-таблицу)
  4. ССЫЛКА НА ПОЛНУЮ БАЗУ МЕТАДАННЫХ библиографических источников для продвинутых участников (ссылка на гугл-таблицу)
  5. Видео-презентация о проекте оцифровки и результатах на 25 июля 2021: ссылка на видео

Задача оцифровки находок грибов, опубликованных в литературе в прошлом, и публикация их в едином ресурсе (GBIF) стоит перед рабочей группой по оцифровке литературных данных СибМикО. Работа в этом направлении началась в 2018 году с интеграции данных о литературных находках на Севере Западной Сибири. В настоящее время мы двигаемся на юг для мобилизации данных южных регионов.

В состав рабочей группы входят микологи, работающие на этой территории и заинтересованные в современных информационных технологиях в области биоразнообразия:

  • Агеев Д.В.
  • Арефьев С.П.
  • Большаков С.Ю.
  • Бульонкова Т.М.
  • Вайшля О.Б.
  • Власенко А.В.
  • Власенко В.А.
  • Гашков С.И.
  • Горбунова И.А.
  • Давыдов Е.А.
  • Добрынина А.С.
  • Звягина Е.А.

  • Капитонов В.А.
  • Кудашова Н.Н.
  • Лутовинова В.А.
  • Макарова Т.А.
  • Мухин В.А.
  • Мингалимова А.И.
  • Пауков А.Г.
  • Рудыкина Е.А.
  • Рябицева Н.Ю.
  • Седельникова Н.В.
  • Ставишенко И.В.

  • Толпышева Т.Ю.
  • Томошевич М.А.
  • Филиппова Н.В.
  • Филиппова А.В.
  • Шабанова Н.
  • Ширяев А.Г.
  • Яковченко Л.С.

Постер о проекте оцифровки на английском (в формате pdf)

Оцифровка литературных находок включает следующие задачи (подробнее см. описание алгоритмов в файле (pdf):

  1. Создание сети сотрудничества. В одиночку этот проект невозможно выполнить из-за большого объема литературы и данных. Поэтому мы контактируем со всеми работающими микологами и приглашаем всех к совместной работе над мобилизацией данных по определенным группам и регионам.
  2. Создание полного библиографического списка потенциальных источников находок видов. Мы составляем список всех опубликованных источников (включая материалы конференций и диссертации) по авторам и регионам. Поиск источников идет из личных архивов ученых и картотек библиотек, по основным микологическим журналам, флорам и т.д. Библиография оформляется в виде базы данных в библиографическом менеджере Zoterо (для этого создан онлайн аккаунт зотеро). Каждый источник, по возможности, дополняется полным текстом публикации. Этот архив становится библиотекой СибМикО на будущее и может использоваться в различных направлениях.
  3. Экстрагирование находок видов из публикаций в базу данных формата GBIF. В последней содержится вся информация о находках видов, разбитая на колонки что, где, когда опубликовано + ссылка на библиографический источник. Координата, если не была указана в источнике, определяется по географическому описанию (геопривязку выполняет сотрудник, которые занимается экстракцией записей, или отдельный человек).
  4. Наконец, интегрированные данные загружаются в GBIF в виде набора данных.

Статьи о литературных базах находок грибов в Западной Сибири:

Filippova N, Arefyev S, Zvyagina E, Kapitonov V, Makarova T, Mukhin V, Sedelnikova N, Stavishenko I, Shiryaev A, Tolpysheva T, Ryabitseva N, Paukov A (2020) Fungal literature records database of the Northern West Siberia (Russia). Biodiversity Data Journal 8: e52963. https://doi.org/10.3897/BDJ.8.e52963

Filippova N, Ageev D, Bolshakov S, Davydov EA, Filippova A, Filippov I, Gashkov S, Gorbunova I, Kalinina L, Kudashova N, Palomozhnykh E, Shabanova N, Tomoshevich M, Vayshlya O, Vlasenko A, Vlasenko V, Vorobʼeva I, Yakovchenko L, Zvyagina E (2021) The fungal literature-based occurrence database for southern West Siberia (Russia). Biodiversity Data Journal 9: e76789. https://doi.org/10.3897/BDJ.9.e76789


Набор данных по Северу Западной Сибири (в границах бывшей Тюменской области):

Filippova N, Arefyev S, Bulyonkova T, Zvyagina E, Kapitonov V, Makarova T, Mukhin V, Stavishenko I, Tavshanzhi E, Shiryaev A, Tolpysheva T, Sedelnikova N, Ryabitseva N, Paukov A, Zhurbenko M (2020). Fungal literature records database of the Northern West Siberia (Russia). Version 1.9. Yugra State University Biological Collection (YSU BC). Occurrence dataset https://doi.org/10.15468/hfje3l accessed via GBIF.org on 2020-03-16.


Набор данных по Югу Западной Сибири (восемь административных регионов):

Filippova N, Ageev D, Bolshakov S, Vayshlya O, Vlasenko A, Vlasenko V, Gashkov S, Gorbunova I, Davydov E, Zvyagina E, Kudashova N, Tomoshevich M, Filippova A, Shabanova N, Yakovchenko L (2021). Fungal literature records database of the Southern West Siberia (Russia). Yugra State University Biological Collection (YSU BC). Metadata dataset https://doi.org/10.15468/eqx72v accessed via GBIF.org on 2021-06-15.


Библиография микологических исследований в Западной Сибири (список из более 1300 работ на 25.01.2022) (doc, excel)


Аккаунт в Zotero с библиотекой микологических публикаций по Западной Сибири (https://www.zotero.org/funws/library (для доступа в библиотеку запросите логин и пароль у Филипповой Н.В.)