Παρακαλώ χρησιμοποιήστε αυτό το αναγνωριστικό για να παραπέμψετε ή να δημιουργήσετε σύνδεσμο προς αυτό το τεκμήριο: https://hdl.handle.net/10442/19512
Export to:   BibTeX  | EndNote  | RIS
Εξειδίκευση τύπου : Άρθρο σε επιστημονικό περιοδικό
Τίτλος: Pre-Meta: Priors-augmented Retrieval for LLM-based Metadata Generation
Δημιουργός/Συγγραφέας: Tinn, Phil
Sørbø, Sondre
Jiang, Shanshan
[EL] Βουτετάκης, Κωνσταντίνος[EN] Voutetakis, Konstantinossemantics logo
Giounis, Sotiris Moudouris
Pilalis, Eleftherios
[EL] Παπαδόδημα, Όλγα[EN] Papadodima, Olgasemantics logo
Roman, Dumitru
Ημερομηνία: 2025-09-18
Γλώσσα: Αγγλικά
ISSN: 1367-4811
DOI: 10.1093/bioinformatics/btaf519
Άλλο: 40973196
Περίληψη: While high-throughput sequencing technologies have dramatically accelerated genomic data generation, the manual processes required for dataset annotation and metadata creation impede the efficient discovery and publication of these resources across disparate public repositories. Large Language Models (LLMs) have the potential to streamline dataset profiling and discovery. However, their current limitations in generalizing across specialized knowledge domains, particularly in fields such as biomedical genomics, prevent them from fully realizing this potential. This paper presents Pre-Meta, an LLM-agnostic and domain-independent data annotation pipeline with an enriched retrieval procedure that leverages related priors-such as pre-generated metadata tags and ontologies-as auxiliary information to improve the accuracy of automated metadata generation.
Τίτλος πηγής δημοσίευσης: Bioinformatics (Oxford, England)
Θεματική Κατηγορία: [EL] Βιοπληροφορική[EN] Bioinformaticssemantics logo
[EL] Πληροφορική[EN] Information technologysemantics logo
[EL] Βάσεις δεδομένων[EN] Databasessemantics logo
Λέξεις-Κλειδιά: Biomedical informatics
Genomic informatics
Large Language Models (LLM)
Χρηματοδοτικό πρόγραμμα: UPCAST
enRichMyData
DataPACT
CauseFinder
Αναγνωριστικό χρηματοδοτικού προγράμματος: HE 101093216
HE 101070284
PNRR 760049
Κάτοχος πνευματικών δικαιωμάτων: © The Author(s) 2025. Published by Oxford University Press.
Όροι και προϋποθέσεις δικαιωμάτων: This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by/4.0/), which permits unrestricted reuse, distribution, and reproduction in any medium, provided the original work is properly cited.
Ηλεκτρονική διεύθυνση στον εκδότη (link): https://doi.org/10.1093/bioinformatics/btaf519
Σημειώσεις: The code, data access, and scripts are available at: https://github.com/SINTEF-SE/LLMDap
Εμφανίζεται στις συλλογές:Ινστιτούτο Χημικής Βιολογίας - Επιστημονικό έργο

Αρχεία σε αυτό το τεκμήριο:
Αρχείο Περιγραφή ΣελίδεςΜέγεθοςΜορφότυποςΈκδοσηΆδεια
Tin Phil et al_2025_btaf519.pdfAccepted manuscript. Open access855.96 kBAdobe PDFΔημοσιευμένη/του ΕκδότηccbyΔείτε/ανοίξτε