TERM31-GS.rs3 (68) |
EDU | Segment | Tagger | Central Unit |
1 | Terminologiaren erauzketa automatikoa eta bere aplikazioa euskararako. | GS | |
2 | 1. Sarrera. | GS | |
3 | Azken urteotan testu teknikoetatik terminologia automatikoki erauzteko tresnak ari dira garatzen zenbait hizkuntzatarako, | GS | |
4 | baina oraindik giza laguntza behar izaten da | GS | |
5 | automatikoki hautatutako terminologiaren artean azken aukeraketa egiteko. | GS | |
6 | Horren adibide gisa, tresna hauek aipa daitezke: LEXTER (Bourigault, 92) AT&Tko Termight (Church & Dagan, 94) IBMko TERMS (Justeson & Katz, 95) NPtool (Arpper, 95). | GS | |
7 | Aplikazio-eremuak bi multzo handitan bana daitezke: | GS | |
8 | informazioa indexatzeko | GS | |
9 | eta terminoen glosategiak eraikitzeko. | GS | |
10 | Gainera, terminologia oso modu dinamikoan bilakatzen den arloetan, informatikan adib., halako tresnarik gabe ia ezinezkoa da lan terminologiko eraginkorrak egitea. | GS | |
11 | Halako tresna bat euskararako garatu nahi badugu, | GS | |
12 | eragozpen gehiago topatuko dugu ondoko hiru arrazoiengatik: | GS | |
13 | bateratze-prozesua bukatzeke izateagatik, | GS | |
14 | egindako ikerketak murritzak direlako | GS | |
15 | eta hizkuntza eranskaria izateagatik. | GS | |
16 | 2. Terminologiaren erauzketa. | GS | |
17 | Terminoaren definizio formal eta osoa lortzea lan neketsua da | GS | |
18 | eta horretan datza lanen atal garrantzitsu bat: terminoen ezaugarriak mugatzea. | GS | |
19 | Corpusetatik termino teknikoak lortzeko | GS | |
20 | konbinatu ohi dira NLPko teknikak (ezagumendu linguistikoan oinarritutakoak) eta teknika estatistikoak. | GS | |
21 | 2.1. Teknika linguistikoak. | GS | |
22 | Teknika linguistikoak erabiltzen dira | GS | |
23 | batez ere terminoen hasierako selekzioa egiteko. | GS | |
24 | Horretarako, | GS | |
25 | eredu morfosintaktikoak erabili ohi direnez gero, | GS | |
26 | komenigarria da testua analizaturik edukitzea edo gutxienez etiketatua. | GS | |
27 | Tresna linguistikoen kalitateak baldintzatuko ditu, hein handi batean behintzat, tresnaren emaitzak. | GS | |
28 | Hala ere, proiektu batzuetan ez da analisi morfologikorik edo sintaktikorik egiten (Su et al., 96). | GS | |
29 | Analisi morfologikoarekin eta desanbiguazioarekin lotuta dago lematizazioa. | GS | |
30 | Flexio konplexuko hizkuntzetan hitz-forma bakarrik tratatzeak emaitza kaxkarrak ekarriko ditu | GS | |
31 | eta lematizazioa ezinbestekoa izango da. | GS | |
32 | Ezagumendu linguistikoa funtsezkoa da terminoen normalizazioan ere; | GS | |
33 | termino batzuk beste luzeago batzuen baitan egon daitezkeenez, | GS | |
34 | haien artean diskriminatu egin behar baita. | GS | |
35 | 2.2. Teknika estatistikoak. | GS | |
36 | Eredu linguistikoari jarraitzen dioten balizko terminoak murrizteko | GS | |
37 | erabili ohi dira metodo estatistikoak proiektu gehienetan. | GS | |
38 | Aplikatutako metodoak asko aldatzen dira proiektuaren arabera: | GS | |
39 | sinpleena izango litzateke maiztasun absolutu minimo bat eskatzea (Justeson & Katz, 95), | GS | |
40 | baina orokorrean formula probabilistiko anitz konbinatzen dira. | GS | |
41 | 2.3. Emaitzak. | GS | |
42 | Lortzen diren emaitzak ez dira oraindik beharko liratekeenak | GS | |
43 | erauzketa zeharo automatikoa egiteko. | GS | |
44 | Oreka bilatu behar da estaldura (recall) eta doitasunaren artean (precision). | GS | |
45 | Oreka horretan estaldurari lehentasuna ematen zaio | GS | |
46 | atzetik terminologia murrizteko pertsona bat badago. | GS | |
47 | % 95 inguruko estaldura lortzeko | GS | |
48 | doitasuna % 50-era jaitsi ohi da, | GS | |
49 | eta doitasuna % 85 ingurukoa izan dadin | GS | |
50 | estaldura % 35era ere ez da iristen. | GS | |
51 | 3. Euskararako aplikazioa. | GS | |
52 | IXA taldearen asmoa da euskararako mota honetako tresna bat garatzea. | GS | |
53 | Horretarako | GS | |
54 | analizatzaile morfologikoa jadanik prest dago (Alegria et al., 96), | GS | |
55 | lematizatzaile/etiketatzaile bat bukatzear dago (Aduriz et al., 96) | GS | |
56 | eta azaleko sintaxiari ere ekin diogu. | GS | |
57 | Tresna horiek prest dauden bitartean | GS | |
58 | termino teknikoen modelizazioari ekin behar diogu, | GS | |
59 | hau da murriztu behar ditugu termino teknikoen ezaugarriak. | GS | |
60 | Horretarako | GS | |
61 | dauden hiztegi teknikoetan oinarritu, | GS | |
62 | eta teknika estatistikoak erabiliz, | GS | |
63 | eredu nagusiak lortu behar dira. | GS | |
64 | Emaitzarik ez badugu ere, | GS | |
65 | eredua izen-sintagmarena baino zabalagoa izango dela susmatzen dugu. | GS | |
66 | Beste aldetik, | GS | |
67 | termino teknikoak hautatzerakoan | GS | |
68 | barneko deklinabidekasua erabakigarria izan daiteke. | GS | |