Сторінка 1 з 1

Як обрати відповідний репозиторій для моїх даних?

Додано: П'ят серпня 15, 2025 9:18 am
admin
📦 Як обрати відповідний репозиторій для моїх даних?

Питання:
1) Чи є рекомендовані або обов’язкові репозиторії для моєї галузі (металофізика, біоінформатика)?
2) Як обрати між Dataverse, Zenodo, Figshare, Dryad?

-----------------------------------------
Передмова: короткі факти та корисні посилання

• Для пошуку профільних сховищ починайте з реєстрів:
– FAIRsharing: https://fairsharing.org/ (реєстр стандартів/репозиторіїв)
– re3data: https://www.re3data.org/ (глобальний каталог репозиторіїв)

• Матеріалознавство / металофізика:
– NOMAD Repository: https://nomad-lab.eu/ (опис у re3data: https://www.re3data.org/repository/r3d100011583)
– Materials Cloud Archive: https://archive.materialscloud.org/ (опис у re3data: https://www.re3data.org/repository/r3d100012611)

• Біоінформатика (приклади дисциплінарних):
– Транскриптоміка/функц. геноміка: GEO (NCBI) https://www.ncbi.nlm.nih.gov/geo/, ArrayExpress → BioStudies (EMBL-EBI) https://www.ebi.ac.uk/biostudies/arraye ... biostudies
– Протеоміка: PRIDE (EMBL-EBI) https://www.ebi.ac.uk/pride/
– Метаболоміка: MetaboLights (EMBL-EBI) https://www.ebi.ac.uk/metabolights
– Людські чутливі дані: EGA (EMBL-EBI) https://ega-archive.org/, dbGaP (NIH) https://dbgap.ncbi.nlm.nih.gov/home

• Загальні репозиторії (ліміти змінюються — перевіряйте на сторінках підтримки):
– Zenodo: політики/ліміти https://help.zenodo.org/docs/deposit/manage-files/, https://support.zenodo.org/help/en-gb/1 ... -of-zenodo
– Figshare: ліміти для figshare.com та інституцій/Plus https://help.figshare.com/article/figsh ... unt-limits, https://info.figshare.com/figshare-plus/
– Dryad: CC0 для даних та публікаційні збори https://datadryad.org/requirements, https://datadryad.org/costs
– Dataverse (гнучкі metadata blocks, API): https://guides.dataverse.org/en/latest/ ... ation.html

• Вимоги журналів/фондів часто передбачають розміщення в профільних сховищах:
– Nature/Scientific Data — перелік рекомендованих репозиторіїв: https://www.nature.com/sdata/policies/repositories
– NIH Genomic Data Sharing (GDS) — де подавати геномні дані: https://grants.nih.gov/policy-and-compl ... licies/gds

-----------------------------------------
З чого почати (чек-лист)
  • Вимоги журналу/фонду: чи вимагають конкретне сховище/ліцензію?
  • Тип даних: дисциплінарні репозиторії (біоінформатика, матеріалознавство) vs загальні.
  • Чутливість: людські геномні/клінічні дані → лише контрольований доступ (EGA/dbGaP).
  • Обсяг і формат: чи помістяться файли за лімітами (GB/TB), чи є попередній перегляд?
  • Ліцензія: чи підходить CC0/CC-BY; чи дозволені обмеження?
  • Інтеграції й автоматизація: API, DOI, версіонування, GitHub/CI, локальна інституційна підтримка.
-----------------------------------------
Рекомендовані дисциплінарні репозиторії

Металофізика / матеріалознавство
  • NOMAD Repository & Archive — великий осередок FAIR-даних з матеріалознавства; засоби аналізу/AI-toolkit. https://nomad-lab.eu/
  • Materials Cloud (Archive/Discover) — робочі процеси AiiDA, публікація сирих та курованих наборів. https://archive.materialscloud.org/
Біоінформатика [tip]Якщо у вашій підгалузі є профільне сховище, краще обрати саме його. Перевіряйте каталоги: https://fairsharing.org/, https://www.re3data.org/.[/tip]

-----------------------------------------
Коли обрати загальні репозиторії

Dataverse / DataverseUA
  • Інституційна підтримка, гнучкі метадані (metadata blocks), версіонування, API.
  • Зручно для змішаних даних проєкту, довгострокового зберігання, локального комплаєнсу.
Zenodo (CERN)
  • DOI, версіонування, інтеграція з GitHub Releases.
  • Добре для публікації статичних релізів, софту і даних помірного обсягу (див. ліміти у довідці).
Figshare
  • Зручні прев’ю, цитування, інституційні інсталяції з великими лімітами.
  • Добре для візуалізацій/постерів/мультимедіа + даних.
Dryad
  • Кюрована публікація даних, тісні зв’язки з журналами; зазвичай CC0; можливі збори.
  • Сфокусовано на даних; код часто радять розміщувати поруч (наприклад, у Zenodo).
-----------------------------------------
Порівняння (коротко)

Код: Виділити все

+-------------+-------------------------+-------------------------------------------+
| Репозиторій | Коли обрати             | Особливості / обмеження                   |
+-------------+-------------------------+-------------------------------------------+
| Dataverse   | Інституційні дані,      | Гнучкі метадані, API, версії; лок. політики|
| (DataverseUA)| змішані формати         |                                           |
| Zenodo      | Релізи, помірні обсяги  | DOI, GitHub інтеграція; після публікації  |
|             |                         | файли не змінюються (створюйте нові версії)|
| Figshare    | Великі файли/прев’ю     | Безкоштовні ліміти для figshare.com,      |
|             |                         | значно більше для інституцій/Plus         |
| Dryad       | Дані для публікації     | Кюровано; CC0; можливий публікаційний збір|
+-------------+-------------------------+-------------------------------------------+
-----------------------------------------
Приклади для галузей
Металофізика/матеріалознавство: NOMAD, Materials Cloud.
Біоінформатика: GEO/BioStudies (транскриптоміка), PRIDE (протеоміка), MetaboLights (метаболоміка), EGA/dbGaP (людські чутливі дані).

-----------------------------------------
Запитання до спільноти
  • У яких репозиторіях публікуєте дані ви? Чи були вимоги журналу/фонду?
  • Чи є профільні сховища для підгалузей (приклади/посилання)?
  • Які ліміти/ліцензії/витрати стали вирішальними у вашому виборі?