Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο:
https://hdl.handle.net/10442/19512
Εξειδίκευση τύπου : | Άρθρο σε επιστημονικό περιοδικό |
Τίτλος: | Pre-Meta: Priors-augmented Retrieval for LLM-based Metadata Generation |
Δημιουργός/Συγγραφέας: | Tinn, Phil Sørbø, Sondre Jiang, Shanshan [EL] Βουτετάκης, Κωνσταντίνος[EN] Voutetakis, Konstantinos Giounis, Sotiris Moudouris Pilalis, Eleftherios [EL] Παπαδόδημα, Όλγα[EN] Papadodima, Olga Roman, Dumitru |
Ημερομηνία: | 2025-09-18 |
Γλώσσα: | Αγγλικά |
ISSN: | 1367-4811 |
DOI: | 10.1093/bioinformatics/btaf519 |
Άλλο: | 40973196 |
Περίληψη: | While high-throughput sequencing technologies have dramatically accelerated genomic data generation, the manual processes required for dataset annotation and metadata creation impede the efficient discovery and publication of these resources across disparate public repositories. Large Language Models (LLMs) have the potential to streamline dataset profiling and discovery. However, their current limitations in generalizing across specialized knowledge domains, particularly in fields such as biomedical genomics, prevent them from fully realizing this potential. This paper presents Pre-Meta, an LLM-agnostic and domain-independent data annotation pipeline with an enriched retrieval procedure that leverages related priors-such as pre-generated metadata tags and ontologies-as auxiliary information to improve the accuracy of automated metadata generation. |
Τίτλος πηγής δημοσίευσης: | Bioinformatics (Oxford, England) |
Θεματική Κατηγορία: | [EL] Βιοπληροφορική[EN] Bioinformatics [EL] Πληροφορική[EN] Information technology [EL] Βάσεις δεδομένων[EN] Databases |
Λέξεις-Κλειδιά: | Biomedical informatics Genomic informatics Large Language Models (LLM) |
Χρηματοδοτικό πρόγραμμα: | UPCAST enRichMyData DataPACT CauseFinder |
Αναγνωριστικό χρηματοδοτικού προγράμματος: | HE 101093216 HE 101070284 PNRR 760049 |
Κάτοχος πνευματικών δικαιωμάτων: | © The Author(s) 2025. Published by Oxford University Press. |
Όροι και προϋποθέσεις δικαιωμάτων: | This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0/), which permits unrestricted reuse, distribution, and reproduction in any medium, provided the original work is properly cited. |
Ηλεκτρονική διεύθυνση στον εκδότη (link): | https://doi.org/10.1093/bioinformatics/btaf519 |
Σημειώσεις: | The code, data access, and scripts are available at: https://github.com/SINTEF-SE/LLMDap |
Εμφανίζεται στις συλλογές: | Ινστιτούτο Χημικής Βιολογίας - Επιστημονικό έργο
|