| TERM31-GS.rs3 (68) |
| EDU | Segment | Tagger | Central Unit |
| 1 | Terminologiaren erauzketa automatikoa eta bere aplikazioa euskararako. | GS | |
| 2 | 1. Sarrera. | GS | |
| 3 | Azken urteotan testu teknikoetatik terminologia automatikoki erauzteko tresnak ari dira garatzen zenbait hizkuntzatarako, | GS | |
| 4 | baina oraindik giza laguntza behar izaten da | GS | |
| 5 | automatikoki hautatutako terminologiaren artean azken aukeraketa egiteko. | GS | |
| 6 | Horren adibide gisa, tresna hauek aipa daitezke: LEXTER (Bourigault, 92) AT&Tko Termight (Church & Dagan, 94) IBMko TERMS (Justeson & Katz, 95) NPtool (Arpper, 95). | GS | |
| 7 | Aplikazio-eremuak bi multzo handitan bana daitezke: | GS | |
| 8 | informazioa indexatzeko | GS | |
| 9 | eta terminoen glosategiak eraikitzeko. | GS | |
| 10 | Gainera, terminologia oso modu dinamikoan bilakatzen den arloetan, informatikan adib., halako tresnarik gabe ia ezinezkoa da lan terminologiko eraginkorrak egitea. | GS | |
| 11 | Halako tresna bat euskararako garatu nahi badugu, | GS | |
| 12 | eragozpen gehiago topatuko dugu ondoko hiru arrazoiengatik: | GS | |
| 13 | bateratze-prozesua bukatzeke izateagatik, | GS | |
| 14 | egindako ikerketak murritzak direlako | GS | |
| 15 | eta hizkuntza eranskaria izateagatik. | GS | |
| 16 | 2. Terminologiaren erauzketa. | GS | |
| 17 | Terminoaren definizio formal eta osoa lortzea lan neketsua da | GS | |
| 18 | eta horretan datza lanen atal garrantzitsu bat: terminoen ezaugarriak mugatzea. | GS | |
| 19 | Corpusetatik termino teknikoak lortzeko | GS | |
| 20 | konbinatu ohi dira NLPko teknikak (ezagumendu linguistikoan oinarritutakoak) eta teknika estatistikoak. | GS | |
| 21 | 2.1. Teknika linguistikoak. | GS | |
| 22 | Teknika linguistikoak erabiltzen dira | GS | |
| 23 | batez ere terminoen hasierako selekzioa egiteko. | GS | |
| 24 | Horretarako, | GS | |
| 25 | eredu morfosintaktikoak erabili ohi direnez gero, | GS | |
| 26 | komenigarria da testua analizaturik edukitzea edo gutxienez etiketatua. | GS | |
| 27 | Tresna linguistikoen kalitateak baldintzatuko ditu, hein handi batean behintzat, tresnaren emaitzak. | GS | |
| 28 | Hala ere, proiektu batzuetan ez da analisi morfologikorik edo sintaktikorik egiten (Su et al., 96). | GS | |
| 29 | Analisi morfologikoarekin eta desanbiguazioarekin lotuta dago lematizazioa. | GS | |
| 30 | Flexio konplexuko hizkuntzetan hitz-forma bakarrik tratatzeak emaitza kaxkarrak ekarriko ditu | GS | |
| 31 | eta lematizazioa ezinbestekoa izango da. | GS | |
| 32 | Ezagumendu linguistikoa funtsezkoa da terminoen normalizazioan ere; | GS | |
| 33 | termino batzuk beste luzeago batzuen baitan egon daitezkeenez, | GS | |
| 34 | haien artean diskriminatu egin behar baita. | GS | |
| 35 | 2.2. Teknika estatistikoak. | GS | |
| 36 | Eredu linguistikoari jarraitzen dioten balizko terminoak murrizteko | GS | |
| 37 | erabili ohi dira metodo estatistikoak proiektu gehienetan. | GS | |
| 38 | Aplikatutako metodoak asko aldatzen dira proiektuaren arabera: | GS | |
| 39 | sinpleena izango litzateke maiztasun absolutu minimo bat eskatzea (Justeson & Katz, 95), | GS | |
| 40 | baina orokorrean formula probabilistiko anitz konbinatzen dira. | GS | |
| 41 | 2.3. Emaitzak. | GS | |
| 42 | Lortzen diren emaitzak ez dira oraindik beharko liratekeenak | GS | |
| 43 | erauzketa zeharo automatikoa egiteko. | GS | |
| 44 | Oreka bilatu behar da estaldura (recall) eta doitasunaren artean (precision). | GS | |
| 45 | Oreka horretan estaldurari lehentasuna ematen zaio | GS | |
| 46 | atzetik terminologia murrizteko pertsona bat badago. | GS | |
| 47 | % 95 inguruko estaldura lortzeko | GS | |
| 48 | doitasuna % 50-era jaitsi ohi da, | GS | |
| 49 | eta doitasuna % 85 ingurukoa izan dadin | GS | |
| 50 | estaldura % 35era ere ez da iristen. | GS | |
| 51 | 3. Euskararako aplikazioa. | GS | |
| 52 | IXA taldearen asmoa da euskararako mota honetako tresna bat garatzea. | GS | |
| 53 | Horretarako | GS | |
| 54 | analizatzaile morfologikoa jadanik prest dago (Alegria et al., 96), | GS | |
| 55 | lematizatzaile/etiketatzaile bat bukatzear dago (Aduriz et al., 96) | GS | |
| 56 | eta azaleko sintaxiari ere ekin diogu. | GS | |
| 57 | Tresna horiek prest dauden bitartean | GS | |
| 58 | termino teknikoen modelizazioari ekin behar diogu, | GS | |
| 59 | hau da murriztu behar ditugu termino teknikoen ezaugarriak. | GS | |
| 60 | Horretarako | GS | |
| 61 | dauden hiztegi teknikoetan oinarritu, | GS | |
| 62 | eta teknika estatistikoak erabiliz, | GS | |
| 63 | eredu nagusiak lortu behar dira. | GS | |
| 64 | Emaitzarik ez badugu ere, | GS | |
| 65 | eredua izen-sintagmarena baino zabalagoa izango dela susmatzen dugu. | GS | |
| 66 | Beste aldetik, | GS | |
| 67 | termino teknikoak hautatzerakoan | GS | |
| 68 | barneko deklinabidekasua erabakigarria izan daiteke. | GS | |