|        TERM31-GS.rs3 (68) | 
| EDU | Segment | Tagger | Central Unit | 
| 1 | Terminologiaren erauzketa automatikoa eta bere aplikazioa euskararako. | GS |  | 
| 2 |  1. Sarrera. | GS |  | 
| 3 |  Azken urteotan testu teknikoetatik terminologia automatikoki erauzteko tresnak ari dira garatzen zenbait hizkuntzatarako, | GS |  | 
| 4 |  baina oraindik giza laguntza behar izaten da | GS |  | 
| 5 |  automatikoki hautatutako terminologiaren artean azken aukeraketa egiteko. | GS |  | 
| 6 |  Horren adibide gisa, tresna hauek aipa daitezke: LEXTER (Bourigault, 92) AT&Tko Termight (Church & Dagan, 94) IBMko TERMS (Justeson & Katz, 95) NPtool (Arpper, 95).  | GS |  | 
| 7 |  Aplikazio-eremuak bi multzo handitan bana daitezke: | GS |  | 
| 8 |  informazioa indexatzeko | GS |  | 
| 9 |  eta terminoen glosategiak eraikitzeko. | GS |  | 
| 10 |  Gainera, terminologia oso modu dinamikoan bilakatzen den arloetan, informatikan adib., halako tresnarik gabe ia ezinezkoa da lan terminologiko eraginkorrak egitea. | GS |  | 
| 11 |  Halako tresna bat euskararako garatu nahi badugu, | GS |  | 
| 12 |  eragozpen gehiago topatuko dugu ondoko hiru arrazoiengatik: | GS |  | 
| 13 |  bateratze-prozesua bukatzeke izateagatik, | GS |  | 
| 14 |  egindako ikerketak murritzak direlako | GS |  | 
| 15 |  eta hizkuntza eranskaria izateagatik. | GS |  | 
| 16 |  2. Terminologiaren erauzketa. | GS |  | 
| 17 |  Terminoaren definizio formal eta osoa lortzea lan neketsua da | GS |  | 
| 18 |  eta horretan datza lanen atal garrantzitsu bat: terminoen ezaugarriak mugatzea. | GS |  | 
| 19 |  Corpusetatik termino teknikoak lortzeko | GS |  | 
| 20 |  konbinatu ohi dira NLPko teknikak (ezagumendu linguistikoan oinarritutakoak) eta teknika estatistikoak. | GS |  | 
| 21 |  2.1. Teknika linguistikoak. | GS |  | 
| 22 |  Teknika linguistikoak erabiltzen dira | GS |  | 
| 23 |  batez ere terminoen hasierako selekzioa egiteko. | GS |  | 
| 24 |  Horretarako, | GS |  | 
| 25 |  eredu morfosintaktikoak erabili ohi direnez gero, | GS |  | 
| 26 |  komenigarria da testua analizaturik edukitzea edo gutxienez etiketatua. | GS |  | 
| 27 |  Tresna linguistikoen kalitateak baldintzatuko ditu, hein handi batean behintzat, tresnaren emaitzak. | GS |  | 
| 28 |  Hala ere, proiektu batzuetan ez da analisi morfologikorik edo sintaktikorik egiten (Su et al., 96). | GS |  | 
| 29 |  Analisi morfologikoarekin eta desanbiguazioarekin lotuta dago lematizazioa. | GS |  | 
| 30 |  Flexio konplexuko hizkuntzetan hitz-forma bakarrik tratatzeak emaitza kaxkarrak ekarriko ditu | GS |  | 
| 31 |  eta lematizazioa ezinbestekoa izango da. | GS |  | 
| 32 |  Ezagumendu linguistikoa funtsezkoa da terminoen normalizazioan ere; | GS |  | 
| 33 |  termino batzuk beste luzeago batzuen baitan egon daitezkeenez, | GS |  | 
| 34 |  haien artean diskriminatu egin behar baita. | GS |  | 
| 35 |  2.2. Teknika estatistikoak. | GS |  | 
| 36 |  Eredu linguistikoari jarraitzen dioten balizko terminoak murrizteko | GS |  | 
| 37 |  erabili ohi dira metodo estatistikoak proiektu gehienetan. | GS |  | 
| 38 |  Aplikatutako metodoak asko aldatzen dira proiektuaren arabera: | GS |  | 
| 39 |  sinpleena izango litzateke maiztasun absolutu minimo bat eskatzea (Justeson & Katz, 95), | GS |  | 
| 40 |  baina orokorrean formula probabilistiko anitz konbinatzen dira. | GS |  | 
| 41 |  2.3. Emaitzak. | GS |  | 
| 42 |  Lortzen diren emaitzak ez dira oraindik beharko liratekeenak | GS |  | 
| 43 |  erauzketa zeharo automatikoa egiteko. | GS |  | 
| 44 |  Oreka bilatu behar da estaldura (recall) eta doitasunaren artean (precision). | GS |  | 
| 45 |  Oreka horretan estaldurari lehentasuna ematen zaio | GS |  | 
| 46 |  atzetik terminologia murrizteko pertsona bat badago. | GS |  | 
| 47 |  % 95 inguruko estaldura lortzeko | GS |  | 
| 48 |  doitasuna % 50-era jaitsi ohi da, | GS |  | 
| 49 |  eta doitasuna % 85 ingurukoa izan dadin | GS |  | 
| 50 |  estaldura % 35era ere ez da iristen. | GS |  | 
| 51 |  3. Euskararako aplikazioa. | GS |  | 
| 52 |  IXA taldearen asmoa da euskararako mota honetako tresna bat garatzea. | GS |  | 
| 53 |  Horretarako | GS |  | 
| 54 |  analizatzaile morfologikoa jadanik prest dago (Alegria et al., 96), | GS |  | 
| 55 |  lematizatzaile/etiketatzaile bat bukatzear dago (Aduriz et al., 96) | GS |  | 
| 56 |  eta azaleko sintaxiari ere ekin diogu. | GS |  | 
| 57 |  Tresna horiek prest dauden bitartean | GS |  | 
| 58 |  termino teknikoen modelizazioari ekin behar diogu, | GS |  | 
| 59 |  hau da murriztu behar ditugu termino teknikoen ezaugarriak. | GS |  | 
| 60 |  Horretarako | GS |  | 
| 61 |  dauden hiztegi teknikoetan oinarritu, | GS |  | 
| 62 |  eta teknika estatistikoak erabiliz, | GS |  | 
| 63 |  eredu nagusiak lortu behar dira. | GS |  | 
| 64 |  Emaitzarik ez badugu ere, | GS |  | 
| 65 |  eredua izen-sintagmarena baino zabalagoa izango dela susmatzen dugu. | GS |  | 
| 66 |  Beste aldetik, | GS |  | 
| 67 |  termino teknikoak hautatzerakoan | GS |  | 
| 68 |  barneko deklinabidekasua erabakigarria izan daiteke. | GS |  |