EuMediCS - Euskarazko Medikuntzaren Domeinuko Corpus Sintetikoa, Itzultzaile Automatikoen Ekarpena
DOI:
https://doi.org/10.26876/ikergazte.vi.03.21Gako-hitzak:
Hizkuntza Eredu Handiak, Itzulpen Automatiko Neuronala, Euskarazko Corpusa, MedikuntzaLaburpena
Azken urteotan, Hizkuntza-Eredu Handiek (HEH) adimen artifizialaren alorra erabat irauli dute, itzulpena eta testu-sintesia bezalako zereginetan berebiziko arrakasta lortuz. Medikuntzaren domeinuan ere, eredu horiek errendimendu handia erakutsi dute, zenbait kasutan gizakion mailara hurbilduz, zeregin horietarako entrenatu direnean. Hala ere, HEH espezializatuen inguruko aurrerapen gehienak baliabide ugari dituzten hizkuntzetan egin dira, hala nola, ingelesean. Hori euskara bezalako hizkuntza gutxituen kalterako da, hizkuntza horietako HEHak urriak eta kalitate baxuagokoak baitira; domeinu espezializatuetan, medikuntzan esate baterako, sarritan existitu ere ez dira egiten. Gauzak horrela, proiektu honen helburua euskarazko medikuntzaren domeinuko lehenengo corpus sintetikoa sortzea da, etorkizunean domeinu horretako HEH bat elikatuko duena. Hori lortze aldera, lehenik, medikuntzaren domeinuko hiru itzulpen-eredu aurkeztuko dira, gaztelaniazko eta ingelesezko testuak euskarara itzultzen dituztenak; ondoren, hiru itzulpen-eredu horien kalitatea ebaluatuko da; azkenik, eredurik egokiena aukeratuko da, eta azken horrekin etorkizunean testuak masiboki euskarara itzuliko dira. Hala, lan hau domeinura egokitutako euskarazko HEHen sorkuntzan ekarpen esanguratsua da, zehazki, medikuntzaren domeinuan.
Lizentzia
Copyright (c) 2025 IkerGazte. Nazioarteko ikerketa euskaraz

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
