Detail projektu

Making Software FAIR: Identifying and Extracting Software Mentions from Open Research Papers and Registering them with PIDs

Období řešení: 1.1.2024 — 31.12.2025

Zdroje financování

Technologická agentura ČR - CHRIST-ERA Call Open Research Data

O projektu

Collaboration with partners to further develop existing ML-based bibliographic extraction tools, which are already state of the art, can significantly improve on current methodologies. By integrating and applying these new tools within established open scholarly infrastructures used by millions of people (CORE, EuropePMC, HAL, Software Heritage), we will increase metadata quality and facilitate the adoption of persistent identifiers across the open repositories network. This will make research software more discoverable within the open scholarly infrastructure in line with FAIR policies. The systematic archival in the Software Heritage universal archive of the corresponding source code, when available, will also make research software available and reusable.

Popis česky
Spolupráce s partnery na dalším vývoji existujících nástrojů pro bibliografickou extrak ci založených na ML, které jsou již nejmodernější, může výrazně zlepšit současné metodiky. Integr ací a aplikací těchto nových nástrojů v rámci zavedených otevřených vědeckých infrastruktur používaných m iliony lidí (CORE, EuropePMC, HAL, Software Heritage) zvýšíme kvalitu metadat a  usnadníme přijetí trvalých identifikátorů v síti otevřených repozitářů. Díky tomu bude výzkumný so ftware lépe zjistitelný v rámci otevřené vědecké infrastruktury v souladu se zásadami FAIR. Systematick á archivace odpovídajícího zdrojového kódu v univerzálním archivu Software Heritage, bude-li k dispozici, r ovněž zpřístupní a znovu použije výzkumný software.

Klíčová slova
open research data, FAIR, ML-based bibliographoc extraction tool

Klíčová slova česky
otevřený výzkum dat, FAIR, nástroj pro extrakci bibliografie založený na ML

Označení

TH86010002

Originální jazyk

angličtina

Řešitelé

Útvary

Ústav počítačové grafiky a multimédií
- odpovědné pracoviště (9.12.2022 - nezadáno)
INRIA, Willow Computer vision and machine learning research laboratory
- spolupříjemce (9.12.2022 - 31.12.2025)
Ústav počítačové grafiky a multimédií
- spolupříjemce (9.12.2022 - 31.12.2025)

Výsledky

CANCELLIERI, M.; DOČEKAL, M.; PRIDE, D.; GRUENPETER, M.; DOUARD, D.; KNOTH, P. Interoperable verification and dissemination of software assets in repositories using COAR Notify. 2025.
Detail

KNOTH, P.; LAURENT, R.; LOPEZ, P.; DI COSMO, R.; SMRŽ, P.; UMERLE, T.; HARRISON, M.; MONTEIL, A.; CANCELLIERI, M.; PRIDE, D. Making Software FAIR: A machine-assisted workflow for the research software lifecycle. 2024.
Detail

DOČEKAL, M.; SMRŽ, P.: Software for Disambiguating Mentions of Software Tools Used in Scientific Papers. URL: https://github.com/SoFairOA/SoFairAgent. (Software)
Detail