Коротко: синхронізація відбувається двома шляхами:
1) Harvest-підхід — OpenAIRE/EOSC періодично збирають (harvest) метадані з вашого репозиторію (OAI-PMH, DCAT-AP, schema.org).
2) Push-підхід — ви оновлюєте метадані через реєстратор (наприклад, DOI у DataCite), а агрегатори забирають зміни автоматично.
Найкраща практика — налаштувати обидва.
-----------------------------------------
1) Що означає “повʼязати оновлення”
Щоб зміни в даних (нова версія, нові файли, опис) зʼявлялися в OpenAIRE/EOSC, ваш набір має:
- сталий ідентифікатор (DOI для набору/версії);
- коректні метадані (автори з ORCID, організації з ROR, гранти/фонди, теми/ключові слова);
- доступний для харвестера інтерфейс метаданих (OAI-PMH/JSON-LD/DCAT-AP);
- налаштування на стороні OpenAIRE/EOSC (додавання вашого джерела в їхній каталог/провайдер-профіль).
2) Практичний чекліст (DataverseUA / інші репозиторії)
- PIDs у метаданих: заповніть ORCID авторів, ROR установи, DOI публікацій, ідентифікатори грантів.
- RelatedIdentifiers: укажіть звʼязки між наборами/версіями (IsDerivedFrom/IsVersionOf).
- Опис та ключові слова: англійською + українською (для кращої індексації).
- OAI-PMH / JSON-LD: переконайтесь, що сторінки наборів віддають машинозчитувані метадані (Dataverse зазвичай має OAI-PMH і schema.org).
- Версії: при мажорних змінах підвищуйте версію (і за потреби — окремий DOI для версії), в описі версії давайте короткі release notes (changelog).
3) Синхронізація з OpenAIRE
- Реєстрація джерела: додайте ваш репозиторій у каталог OpenAIRE (через їхню адмін-панель для провайдерів).
- Валідація: перевірте відповідність “OpenAIRE Guidelines” (поля авторів, грантів, ідентифікаторів, ліцензій).
- Harvest: після публікації/оновлення запису OpenAIRE збиратиме оновлені метадані з вашого OAI-PMH/JSON-LD.
- Збагачення: OpenAIRE може додати ORCID/гранти автоматично; перевіряйте, чи коректно “склеєні” записи.
-----------------------------------------
4) Синхронізація з EOSC Catalogue & Marketplace
EOSC індексує провайдерів і ресурси (дані, сервіси). Дії:
- Стати провайдером: створіть профіль провайдера у EOSC та опишіть ресурси (набори/сервіси).
- Метадані: надайте опис у форматі, сумісному з DCAT-AP (title, description, landingPage, distribution, accessURL, theme, contactPoint).
- Harvest: якщо у вас є DCAT-AP endpoint/каталог — вкажіть його, щоб EOSC забирав оновлення автоматично.
- Версії: відображайте версійність у полях версії/дати, додавайте DOI конкретних релізів.
5) Push-оновлення через DOI (DataCite)
Навіть якщо harvest працює, варто оновлювати метадані через реєстратора DOI:
- При новій версії оновіть метадані DOI: назву, автора, опис, дати, посилання на повʼязані ресурси (RelatedIdentifier — “IsNewVersionOf/IsPreviousVersionOf/IsSupplementTo”).
- Агрегатори (OpenAIRE/EOSC) зазвичай підтягують ці зміни автоматично.
- Додавайте ліцензію, ключові слова, галузеві класифікації — це покращує пошук.
6) Автоматизація (CI/CD) — приклад стратегії
- Після релізу набору (Dataverse/Zenodo):
- скрипт CI читає `metadata/CHANGELOG.md`,
- оновлює опис версії (API репозиторію),
- викликає оновлення метаданих DOI (DataCite API). - Плановий тригер (щодня/щотижня): перевірка стану індексації у OpenAIRE/EOSC (де доступно) і звіт у ваш канал/форум.
7) Часті питання (FAQ)
Чи обовʼязково створювати новий DOI для кожної версії?
Залежить від репозиторію. Для відтворюваності вказуйте конкретну версію: Version DOI (Zenodo/Figshare/Dryad) або DOI набору + номер версії (Dataverse).
Що, якщо OpenAIRE не показує мої останні правки?
Перевірте, чи оновився запис у вашому OAI-PMH/JSON-LD (дата зміни), і дочекайтесь наступного harvest-циклу. За потреби — зверніться до підтримки з посиланням на конкретний запис.
Чи можна в EOSC оновлювати метадані “вручну”?
Так, через профіль провайдера/ресурсу. Для масштабних оновлень краще використовувати сумісний endpoint (DCAT-AP) або API для інжесту.
-----------------------------------------
Запитання до спільноти
- Який шлях синхронізації працює у вас: OAI-PMH/DCAT-AP чи через DOI-реєстратора?
- Чи є у вас CI, який після релізу оновлює опис версії та DOI-метадані?
- З якими полями найчастіше виникають помилки при валідації (автори/гранти/ліцензії)?