Питання:
1) Чи є рекомендовані або обов’язкові репозиторії для моєї галузі (металофізика, біоінформатика)?
2) Як обрати між Dataverse, Zenodo, Figshare, Dryad?
-----------------------------------------
Передмова: короткі факти та корисні посилання
• Для пошуку профільних сховищ починайте з реєстрів:
– FAIRsharing: https://fairsharing.org/ (реєстр стандартів/репозиторіїв)
– re3data: https://www.re3data.org/ (глобальний каталог репозиторіїв)
• Матеріалознавство / металофізика:
– NOMAD Repository: https://nomad-lab.eu/ (опис у re3data: https://www.re3data.org/repository/r3d100011583)
– Materials Cloud Archive: https://archive.materialscloud.org/ (опис у re3data: https://www.re3data.org/repository/r3d100012611)
• Біоінформатика (приклади дисциплінарних):
– Транскриптоміка/функц. геноміка: GEO (NCBI) https://www.ncbi.nlm.nih.gov/geo/, ArrayExpress → BioStudies (EMBL-EBI) https://www.ebi.ac.uk/biostudies/arraye ... biostudies
– Протеоміка: PRIDE (EMBL-EBI) https://www.ebi.ac.uk/pride/
– Метаболоміка: MetaboLights (EMBL-EBI) https://www.ebi.ac.uk/metabolights
– Людські чутливі дані: EGA (EMBL-EBI) https://ega-archive.org/, dbGaP (NIH) https://dbgap.ncbi.nlm.nih.gov/home
• Загальні репозиторії (ліміти змінюються — перевіряйте на сторінках підтримки):
– Zenodo: політики/ліміти https://help.zenodo.org/docs/deposit/manage-files/, https://support.zenodo.org/help/en-gb/1 ... -of-zenodo
– Figshare: ліміти для figshare.com та інституцій/Plus https://help.figshare.com/article/figsh ... unt-limits, https://info.figshare.com/figshare-plus/
– Dryad: CC0 для даних та публікаційні збори https://datadryad.org/requirements, https://datadryad.org/costs
– Dataverse (гнучкі metadata blocks, API): https://guides.dataverse.org/en/latest/ ... ation.html
• Вимоги журналів/фондів часто передбачають розміщення в профільних сховищах:
– Nature/Scientific Data — перелік рекомендованих репозиторіїв: https://www.nature.com/sdata/policies/repositories
– NIH Genomic Data Sharing (GDS) — де подавати геномні дані: https://grants.nih.gov/policy-and-compl ... licies/gds
-----------------------------------------
З чого почати (чек-лист)
- Вимоги журналу/фонду: чи вимагають конкретне сховище/ліцензію?
- Тип даних: дисциплінарні репозиторії (біоінформатика, матеріалознавство) vs загальні.
- Чутливість: людські геномні/клінічні дані → лише контрольований доступ (EGA/dbGaP).
- Обсяг і формат: чи помістяться файли за лімітами (GB/TB), чи є попередній перегляд?
- Ліцензія: чи підходить CC0/CC-BY; чи дозволені обмеження?
- Інтеграції й автоматизація: API, DOI, версіонування, GitHub/CI, локальна інституційна підтримка.
Рекомендовані дисциплінарні репозиторії
Металофізика / матеріалознавство
- NOMAD Repository & Archive — великий осередок FAIR-даних з матеріалознавства; засоби аналізу/AI-toolkit. https://nomad-lab.eu/
- Materials Cloud (Archive/Discover) — робочі процеси AiiDA, публікація сирих та курованих наборів. https://archive.materialscloud.org/
- Транскриптоміка/функціональна геноміка: GEO (NCBI) https://www.ncbi.nlm.nih.gov/geo/, BioStudies (ArrayExpress) https://www.ebi.ac.uk/biostudies/arraye ... biostudies
- Протеоміка: PRIDE https://www.ebi.ac.uk/pride/
- Метаболоміка: MetaboLights https://www.ebi.ac.uk/metabolights
- Людські геномно-фенотипові дані (чутливі): EGA https://ega-archive.org/ / dbGaP https://dbgap.ncbi.nlm.nih.gov/home
-----------------------------------------
Коли обрати загальні репозиторії
Dataverse / DataverseUA
- Інституційна підтримка, гнучкі метадані (metadata blocks), версіонування, API.
- Зручно для змішаних даних проєкту, довгострокового зберігання, локального комплаєнсу.
- DOI, версіонування, інтеграція з GitHub Releases.
- Добре для публікації статичних релізів, софту і даних помірного обсягу (див. ліміти у довідці).
- Зручні прев’ю, цитування, інституційні інсталяції з великими лімітами.
- Добре для візуалізацій/постерів/мультимедіа + даних.
- Кюрована публікація даних, тісні зв’язки з журналами; зазвичай CC0; можливі збори.
- Сфокусовано на даних; код часто радять розміщувати поруч (наприклад, у Zenodo).
Порівняння (коротко)
Код: Виділити все
+-------------+-------------------------+-------------------------------------------+
| Репозиторій | Коли обрати | Особливості / обмеження |
+-------------+-------------------------+-------------------------------------------+
| Dataverse | Інституційні дані, | Гнучкі метадані, API, версії; лок. політики|
| (DataverseUA)| змішані формати | |
| Zenodo | Релізи, помірні обсяги | DOI, GitHub інтеграція; після публікації |
| | | файли не змінюються (створюйте нові версії)|
| Figshare | Великі файли/прев’ю | Безкоштовні ліміти для figshare.com, |
| | | значно більше для інституцій/Plus |
| Dryad | Дані для публікації | Кюровано; CC0; можливий публікаційний збір|
+-------------+-------------------------+-------------------------------------------+
Приклади для галузей
Металофізика/матеріалознавство: NOMAD, Materials Cloud.
Біоінформатика: GEO/BioStudies (транскриптоміка), PRIDE (протеоміка), MetaboLights (метаболоміка), EGA/dbGaP (людські чутливі дані).
-----------------------------------------
Запитання до спільноти
- У яких репозиторіях публікуєте дані ви? Чи були вимоги журналу/фонду?
- Чи є профільні сховища для підгалузей (приклади/посилання)?
- Які ліміти/ліцензії/витрати стали вирішальними у вашому виборі?