TERM31-GS.rs3 (68)
EDUSegmentTaggerCentral Unit
1Terminologiaren erauzketa automatikoa eta bere aplikazioa euskararako.GS
2 1. Sarrera.GS
3 Azken urteotan testu teknikoetatik terminologia automatikoki erauzteko tresnak ari dira garatzen zenbait hizkuntzatarako,GS
4 baina oraindik giza laguntza behar izaten daGS
5 automatikoki hautatutako terminologiaren artean azken aukeraketa egiteko.GS
6 Horren adibide gisa, tresna hauek aipa daitezke: LEXTER (Bourigault, 92) AT&Tko Termight (Church & Dagan, 94) IBMko TERMS (Justeson & Katz, 95) NPtool (Arpper, 95). GS
7 Aplikazio-eremuak bi multzo handitan bana daitezke:GS
8 informazioa indexatzekoGS
9 eta terminoen glosategiak eraikitzeko.GS
10 Gainera, terminologia oso modu dinamikoan bilakatzen den arloetan, informatikan adib., halako tresnarik gabe ia ezinezkoa da lan terminologiko eraginkorrak egitea.GS
11 Halako tresna bat euskararako garatu nahi badugu,GS
12 eragozpen gehiago topatuko dugu ondoko hiru arrazoiengatik:GS
13 bateratze-prozesua bukatzeke izateagatik,GS
14 egindako ikerketak murritzak direlakoGS
15 eta hizkuntza eranskaria izateagatik.GS
16 2. Terminologiaren erauzketa.GS
17 Terminoaren definizio formal eta osoa lortzea lan neketsua daGS
18 eta horretan datza lanen atal garrantzitsu bat: terminoen ezaugarriak mugatzea.GS
19 Corpusetatik termino teknikoak lortzekoGS
20 konbinatu ohi dira NLPko teknikak (ezagumendu linguistikoan oinarritutakoak) eta teknika estatistikoak.GS
21 2.1. Teknika linguistikoak.GS
22 Teknika linguistikoak erabiltzen diraGS
23 batez ere terminoen hasierako selekzioa egiteko.GS
24 Horretarako,GS
25 eredu morfosintaktikoak erabili ohi direnez gero,GS
26 komenigarria da testua analizaturik edukitzea edo gutxienez etiketatua.GS
27 Tresna linguistikoen kalitateak baldintzatuko ditu, hein handi batean behintzat, tresnaren emaitzak.GS
28 Hala ere, proiektu batzuetan ez da analisi morfologikorik edo sintaktikorik egiten (Su et al., 96).GS
29 Analisi morfologikoarekin eta desanbiguazioarekin lotuta dago lematizazioa.GS
30 Flexio konplexuko hizkuntzetan hitz-forma bakarrik tratatzeak emaitza kaxkarrak ekarriko dituGS
31 eta lematizazioa ezinbestekoa izango da.GS
32 Ezagumendu linguistikoa funtsezkoa da terminoen normalizazioan ere;GS
33 termino batzuk beste luzeago batzuen baitan egon daitezkeenez,GS
34 haien artean diskriminatu egin behar baita.GS
35 2.2. Teknika estatistikoak.GS
36 Eredu linguistikoari jarraitzen dioten balizko terminoak murriztekoGS
37 erabili ohi dira metodo estatistikoak proiektu gehienetan.GS
38 Aplikatutako metodoak asko aldatzen dira proiektuaren arabera:GS
39 sinpleena izango litzateke maiztasun absolutu minimo bat eskatzea (Justeson & Katz, 95),GS
40 baina orokorrean formula probabilistiko anitz konbinatzen dira.GS
41 2.3. Emaitzak.GS
42 Lortzen diren emaitzak ez dira oraindik beharko liratekeenakGS
43 erauzketa zeharo automatikoa egiteko.GS
44 Oreka bilatu behar da estaldura (recall) eta doitasunaren artean (precision).GS
45 Oreka horretan estaldurari lehentasuna ematen zaioGS
46 atzetik terminologia murrizteko pertsona bat badago.GS
47 % 95 inguruko estaldura lortzekoGS
48 doitasuna % 50-era jaitsi ohi da,GS
49 eta doitasuna % 85 ingurukoa izan dadinGS
50 estaldura % 35era ere ez da iristen.GS
51 3. Euskararako aplikazioa.GS
52 IXA taldearen asmoa da euskararako mota honetako tresna bat garatzea.GS
53 HorretarakoGS
54 analizatzaile morfologikoa jadanik prest dago (Alegria et al., 96),GS
55 lematizatzaile/etiketatzaile bat bukatzear dago (Aduriz et al., 96)GS
56 eta azaleko sintaxiari ere ekin diogu.GS
57 Tresna horiek prest dauden bitarteanGS
58 termino teknikoen modelizazioari ekin behar diogu,GS
59 hau da murriztu behar ditugu termino teknikoen ezaugarriak.GS
60 HorretarakoGS
61 dauden hiztegi teknikoetan oinarritu,GS
62 eta teknika estatistikoak erabiliz,GS
63 eredu nagusiak lortu behar dira.GS
64 Emaitzarik ez badugu ere,GS
65 eredua izen-sintagmarena baino zabalagoa izango dela susmatzen dugu.GS
66 Beste aldetik,GS
67 termino teknikoak hautatzerakoanGS
68 barneko deklinabidekasua erabakigarria izan daiteke.GS