Osasun-arloko entitate izendunen etiketatzea
DOI:
https://doi.org/10.26876/ikergazte.v.03.12Gako-hitzak:
Entitate izendunen ezagutza, hizkuntza-ereduak, Wikidata, medikuntzaLaburpena
Lan honek helburu bikoitza du: alde batetik, transformerretan oinarritutako hizkuntza-ereduak erabiliz medikuntzaren alorreko entitate izendunen identifikazioa egiten du, eta bestetik, identifikatutako entitate klinikoak Wikidata ezagutza-baseko gaixotasunekin eta sintomekin lotzen ditu. Entitateak ezagutzeko, biomedikuntzako MedMentions corpusaren gainean, aldez aurretik entrenatutako BERT hizkuntza-eredu orokor batekin (BERT small) eta bi BERT espezializaturekin (BiomedNLP-PubMedBERT eta BioBERT) egin dira esperimentuak. Token segida batek medikuntzako entitate bat osatzen ote duen ebaluatu denean, 0,819ko F1 balioa lortu da, eta entitatea zein klase zehatzetakoa den ebaluatu denean, 0,62ko F1 balioa. Gainera, Levenhstein distantzia erabiliz ezagututako entitateak Wikidatarekin lotzeko lehenengo saiakeran %50 inguruko estaldura lortu da.
Lizentzia
Copyright (c) 2023 IkerGazte. Nazioarteko ikerketa euskaraz

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
