Making Software FAIR: Identifying and Extracting Software Mentions from Open Research Papers and Registering them with PIDs

Období řešení: 1.1.2024 — 31.12.2025

Zdroje financování

Technologická agentura ČR - CHRIST-ERA Call Open Research Data

O projektu

Collaboration with partners to further develop existing ML-based bibliographic extraction tools, which are already state of the art, can significantly improve on current methodologies. By integrating and applying these new tools within established open scholarly infrastructures used by millions of people (CORE, EuropePMC, HAL, Software Heritage), we will increase metadata quality and facilitate the adoption of persistent identifiers across the open repositories network. This will make research software more discoverable within the open scholarly infrastructure in line with FAIR policies. The systematic archival in the Software Heritage universal archive of the corresponding source code, when available, will also make research software available and reusable.

Popis česky
Spolupráce s partnery na dalším vývoji existujících nástrojů pro bibliografickou extrakci založených na ML, které jsou již nejmodernější, může výrazně zlepšit současné metodiky. Integrací a aplikací těchto nových nástrojů v rámci zavedených otevřených vědeckých infrastruktur používaných miliony lidí (CORE, EuropePMC, HAL, Software Heritage) zvýšíme kvalitu metadat a usnadníme přijetí trvalých identifikátorů v síti otevřených repozitářů. Díky tomu bude výzkumný software lépe zjistitelný v rámci otevřené vědecké infrastruktury v souladu se zásadami FAIR. Systematická archivace odpovídajícího zdrojového kódu v univerzálním archivu Software Heritage, bude-li k dispozici, rovněž zpřístupní a znovu použije výzkumný software.

Klíčová slova
open research data, FAIR, ML-based bibliographoc extraction tool

Klíčová slova česky
otevřený výzkum dat, FAIR, nástroj pro extrakci bibliografie založený na ML

Označení

TH86010002

Originální jazyk

angličtina

Řešitelé

Smrž Pavel, doc. RNDr., Ph.D. - hlavní řešitel
Dočekal Martin, Ing. - spoluřešitel
Dytrych Jaroslav, Ing., Ph.D. - spoluřešitel
Fajčík Martin, Ing., Ph.D. - spoluřešitel
Juránková Markéta, Ing., Ph.D. - spoluřešitel
Matýšek Michal, Ing. - spoluřešitel

Útvary

Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (9.12.2022 - nezadáno)
INRIA, Willow Computer vision and machine learning research laboratory
- spolupříjemce (1.1.2024 - 31.12.2025)
Ústav počítačové grafiky a multimédií
- spolupříjemce (1.1.2024 - 31.12.2025)

Výsledky

CANCELLIERI, M.; DOČEKAL, M.; PRIDE, D.; GRUENPETER, M.; DOUARD, D.; KNOTH, P. Interoperable verification and dissemination of software assets in repositories using COAR Notify. 2025.
Detail

KNOTH, P.; LAURENT, R.; LOPEZ, P.; DI COSMO, R.; SMRŽ, P.; UMERLE, T.; HARRISON, M.; MONTEIL, A.; CANCELLIERI, M.; PRIDE, D. Making Software FAIR: A machine-assisted workflow for the research software lifecycle. 2024.
Detail

DOČEKAL, M.; SMRŽ, P.: Software for Disambiguating Mentions of Software Tools Used in Scientific Papers. URL: https://github.com/SoFairOA/SoFairAgent. (Software)
Detail

Odpovědnost: Smrž Pavel, doc. RNDr., Ph.D.

VUT

Fakulty a vysokoškolské ústavy

Součásti

Making Software FAIR: Identifying and Extracting Software Mentions from Open Research Papers and Registering them with PIDs