Інструменти EOSC для PID: PID Meta Resolver, Data Type Registry, PID Graph, PID Policy Compliance Assessment Toolkit
Додано: Вів вересня 09, 2025 8:54 am
Інструменти EOSC для PID: PID Meta Resolver, Data Type Registry, PID Graph, PID Policy Compliance Assessment Toolkit (CAT)
Мета теми — коротко пояснити, що це за сервіси, навіщо вони нам у DataverseUA, як почати інтеграцію. Тут збираємо запитання, кейси та пропозиції.
1) PID Meta Resolver (PIDMR)
Що це? Узагальнений резолвер, який “розуміє” різні типи PID (DOI, URN тощо), скеровує запити до відповідних провайдерів і повертає базове “ядро” метаданих. Зручно для машинної обробки та точного цитування.
Навіщо нам? Єдина точка входу для різних PID у пайплайнах (перевірки, збагачення метаданих, звітність), у т.ч. для автоматичних перевірок у DataverseUA.
Перші кроки інтеграції DataverseUA:
2) Data Type Registry (DTR)
Що це? Реєстр типів даних/метаданих із PID для самих типів: дає реєструвати й версіонувати визначення типів, схеми та обмеження, а також перевіряти відповідність записів заявленим типам (“machine-actionable”).
Навіщо нам? Узгоджені типи для полів та структур (напр., STM/XPS), щоб валідатори та агрегатори (OpenAIRE/B2FIND) однозначно інтерпретували записи.
Перші кроки інтеграції DataverseUA:
3) PID Graph
Що це? Мережа взаємопов’язаних PID (DOI публікацій/даних, ORCID авторів, ROR організацій тощо), що дає відкривати зв’язки “на кілька стрибків” (напр.: набір даних → публікація → автор → установа). Практично — через API (зокрема GraphQL від DataCite).
Навіщо нам? Показ зв’язків DataverseUA із публікаціями, авторами й організаціями; збагачення лендинг-сторінок наборів; аналітика імпакту.
Приклад запиту (GraphQL):
Посилання: FREYA • DataCite GraphQL API
4) PID Policy Compliance Assessment Toolkit (CAT)
Що це? Інструмент для самооцінки відповідності політикам PID в EOSC (можна розширювати під TRUST, FAIR, GDPR, ліцензії). Є UI та API; результати кодуються, зберігаються, запитуються.
Навіщо нам? Стандартизований чек відповідності PID-політикам для інститутів/сховищ/сервісів; можна вбудувати в аудити DataverseUA і публічні звіти.
Перші кроки інтеграції DataverseUA:
Що пропонуємо зробити спільноті DataverseUA
P.S. Якщо хтось уже інтегрував ці сервіси з Dataverse (hook-и PostPublish / ExternalTools / OAI-PMH), поділіться, будь ласка, прикладами конфігурацій та скриптів.
Мета теми — коротко пояснити, що це за сервіси, навіщо вони нам у DataverseUA, як почати інтеграцію. Тут збираємо запитання, кейси та пропозиції.
1) PID Meta Resolver (PIDMR)
Що це? Узагальнений резолвер, який “розуміє” різні типи PID (DOI, URN тощо), скеровує запити до відповідних провайдерів і повертає базове “ядро” метаданих. Зручно для машинної обробки та точного цитування.
Навіщо нам? Єдина точка входу для різних PID у пайплайнах (перевірки, збагачення метаданих, звітність), у т.ч. для автоматичних перевірок у DataverseUA.
Перші кроки інтеграції DataverseUA:
- Додати в скрипти крок “спробувати PIDMR” перед зверненням до конкретного резолвера.
- Зберігати повернуте “ядро” метаданих як JSON-файл у наборі для контролю якості.
- Порівнювати з локальними метаданими Dataverse (quality check) у публікаційному workflow.
2) Data Type Registry (DTR)
Що це? Реєстр типів даних/метаданих із PID для самих типів: дає реєструвати й версіонувати визначення типів, схеми та обмеження, а також перевіряти відповідність записів заявленим типам (“machine-actionable”).
Навіщо нам? Узгоджені типи для полів та структур (напр., STM/XPS), щоб валідатори та агрегатори (OpenAIRE/B2FIND) однозначно інтерпретували записи.
Перші кроки інтеграції DataverseUA:
- Зробити мапінг полів custom metadata blocks → типи у DTR.
- Зберігати PID типу у полі метаданих (щоб валідатори могли підтягнути схему).
- Додати крок валідації “Dataverse JSON ↔ DTR тип” у публікаційний workflow.
3) PID Graph
Що це? Мережа взаємопов’язаних PID (DOI публікацій/даних, ORCID авторів, ROR організацій тощо), що дає відкривати зв’язки “на кілька стрибків” (напр.: набір даних → публікація → автор → установа). Практично — через API (зокрема GraphQL від DataCite).
Навіщо нам? Показ зв’язків DataverseUA із публікаціями, авторами й організаціями; збагачення лендинг-сторінок наборів; аналітика імпакту.
Приклад запиту (GraphQL):
Код: Виділити все
POST https://api.datacite.org/graphql
{
works(query: "doi:10.xxxx/xxxx") {
totalCount
nodes {
titles { title }
authors { author { name id } } # ORCID
affiliations { affiliation { id name } }# ROR
citations { nodes { doi } } # пов’язані DOI
}
}
}
4) PID Policy Compliance Assessment Toolkit (CAT)
Що це? Інструмент для самооцінки відповідності політикам PID в EOSC (можна розширювати під TRUST, FAIR, GDPR, ліцензії). Є UI та API; результати кодуються, зберігаються, запитуються.
Навіщо нам? Стандартизований чек відповідності PID-політикам для інститутів/сховищ/сервісів; можна вбудувати в аудити DataverseUA і публічні звіти.
Перші кроки інтеграції DataverseUA:
- Сформувати мінімальний policy profile для наших кейсів.
- Запускати CAT періодично (CI) та публікувати коротке резюме на сайті.
- Відслідковувати регресії (невідповідності) як інциденти якості.
Що пропонуємо зробити спільноті DataverseUA
- Тест-пілот: 3–5 наборів із різних дисциплін (STM/XPS/bio/agro) пройти повний цикл: PIDMR → DTR → PID Graph → CAT.
- Мапінг метаданих: узгодити відповідність полів до типів у DTR (список/таблиця).
- Інтеграційні скрипти: мінімальні приклади (curl/python) для кожного сервісу; викласти у GitHub.
- Збір запитань: у цій темі залишайте кейси, помилки, побажання (посилання на набори обов’язкове).
P.S. Якщо хтось уже інтегрував ці сервіси з Dataverse (hook-и PostPublish / ExternalTools / OAI-PMH), поділіться, будь ласка, прикладами конфігурацій та скриптів.