Segments | Relation type | Relation name | Document | Tagger | Area | Notes |
Komunikazio honetan, katalanerako terminologia normalizatzeko lanetan izandako eskarmentutik hasita, batetik, gizarteak terminologia normaltzeko duen beharra aurkeztuko dugu, | hurrengo, horretarako dauden zenbait zailtasun aipatuko ditugu,
| eta, amaitu orduko, ideia batzuk plazaratuko ditugu hori guztia egungo gizartean bideratu ahal izateko.
| sequence | N-N | TERM19_A3.rs3 | A3 | TERM | |
After obtaining the full texts in both languages on a computer data carrier, we proceeded to compare and set out in parallel the two versions so that we could identify with numbers those paragraphs which had the same contents. | Using a special application we then established connections between the appearances of the main terms in the Spanish list already drawn up and the context paragraphs and paragraphs with the same numbers in the Basque version.
| We then located the segments of the paragraphs in Basque which contained the term equivalent to the Spanish one,
| and transferred the whole thing to a relational database.
| secuencia | N-N | TERM28_A1.rs3 | A1 | TERM | |
Tras obtener el soporte informático con la totalidad de los textos en ambos idiomas, hemos procedido a confrontar y paralelizar las dos versiones, a fin de identificar numéricamente los párrafos que tengan el mismo contenido. | A continuación, hemos localizado en los párrafos en euskera el segmento que alberga el contenido equivalente del término castellano,
| y todo ello lo hemos trasladado a una base de datos relacional.
| sequence | N-N | TERM28_A2.rs3 | A2 | TERM | |
Bi hizkuntzetako testu guztiak euskarri informatikoan eskuratu ondoren, bi bertsioen alderatzeari, eta paralelizatzeari ekin diogu, eduki bereko testu-zatiak zenbaki bereko paragrafoan ager daitezen bietan. | Ondoren aplikazio berezi baten bidez, aldez aurretik prestaturiko gaztelaniazko zerrenda bateko termino garrantzitsuenen agerpenak, bere testuinguru-paragrafo osoarekin, eta zenbaki bereko euskal bertsioko paragrafoarekin, lortu ditugu.
| Ondoren, euskarazko paragrafoetan, erdal terminoaren eduki baliokidea daraman segmentua lokalizatu dugu, eta guztia, datu-base erlazional batera eraman.
| sequence | N-N | TERM28_A3.rs3 | A3 | TERM | |
Ondoren, euskarazko paragrafoetan, erdal terminoaren eduki baliokidea daraman segmentua lokalizatu dugu, | eta guztia, datu-base erlazional batera eraman.
| sequence | N-N | TERM28_A3.rs3 | A3 | TERM | |
Horrek amaieragabeko erronka ekarri izan dio | -eta oraindik ere hala dakarkio-
| sequence | N-N | TERM29_A3.rs3 | A3 | TERM | |
1. Sarrera
Azken urteotan testu teknikoetatik terminologia automatikoki erauzteko tresnak ari dira garatzen zenbait hizkuntzatarako, baina oraindik giza laguntza behar izaten da automatikoki hautatutako terminologiaren artean azken aukeraketa egiteko. Horren adibide gisa, tresna hauek aipa daitezke: LEXTER (Bourigault, 92) AT&Tko Termight (Church & Dagan, 94) IBMko TERMS (Justeson & Katz, 95) NPtool (Arpper, 95).
Aplikazio-eremuak bi multzo handitan bana daitezke: informazioa indexatzeko eta terminoen glosategiak eraikitzeko. Gainera, terminologia oso modu dinamikoan bilakatzen den arloetan, informatikan adib., halako tresnarik gabe ia ezinezkoa da lan terminologiko eraginkorrak egitea.
Halako tresna bat euskararako garatu nahi badugu, eragozpen gehiago topatuko dugu ondoko hiru arrazoiengatik: bateratze-prozesua bukatzeke izateagatik, egindako ikerketak murritzak direlako eta hizkuntza eranskaria izateagatik. | 2. Terminologiaren erauzketa
Terminoaren definizio formal eta osoa lortzea lan neketsua da eta horretan datza lanen atal garrantzitsu bat: terminoen ezaugarriak mugatzea. Corpusetatik termino teknikoak lortzeko konbinatu ohi dira NLPko teknikak (ezagumendu linguistikoan oinarritutakoak) eta teknika estatistikoak.
2.1. Teknika linguistikoak
Teknika linguistikoak erabiltzen dira batez ere terminoen hasierako selekzioa egiteko. Horretarako, eredu morfosintaktikoak erabili ohi direnez gero, komenigarria da testua analizaturik edukitzea edo gutxienez etiketatua. Tresna linguistikoen kalitateak baldintzatuko ditu, hein handi batean behintzat, tresnaren emaitzak. Hala ere, proiektu batzuetan ez da analisi morfologikorik edo sintaktikorik egiten (Su et al., 96).
Analisi morfologikoarekin eta desanbiguazioarekin lotuta dago lematizazioa. Flexio konplexuko hizkuntzetan hitz-forma bakarrik tratatzeak emaitza kaxkarrak ekarriko ditu eta lematizazioa ezinbestekoa izango da. Ezagumendu linguistikoa funtsezkoa da terminoen normalizazioan ere; termino batzuk beste luzeago batzuen baitan egon daitezkeenez, haien artean diskriminatu egin behar baita.
2.2 .Teknika estatistikoak
Eredu linguistikoari jarraitzen dioten balizko terminoak murrizteko erabili ohi dira metodo estatistikoak proiektu gehienetan. Aplikatutako metodoak asko aldatzen dira proiektuaren arabera: sinpleena izango litzateke maiztasun absolutu minimo bat eskatzea (Justeson & Katz, 95), baina orokorrean formula probabilistiko anitz konbinatzen dira.
2.3. Emaitzak
Lortzen diren emaitzak ez dira oraindik beharko liratekeenak erauzketa zeharo automatikoa egiteko. Oreka bilatu behar da estaldura (recall) eta doitasunaren artean (precision). Oreka horretan estaldurari lehentasuna ematen zaio atzetik terminologia murrizteko pertsona bat badago. % 95 inguruko estaldura lortzeko doitasuna % 50-era jaitsi ohi da, eta doitasuna % 85 ingurukoa izan dadin estaldura % 35era ere ez da iristen.
| 3. Euskararako aplikazioa
IXA taldearen asmoa da euskararako mota honetako tresna bat garatzea. Horretarako analizatzaile morfologikoa jadanik prest dago (Alegria et al., 96), lematizatzaile/etiketatzaile bat bukatzear dago (Aduriz et al., 96) eta azaleko sintaxiari ere ekin diogu.
Tresna horiek prest dauden bitartean termino teknikoen modelizazioari ekin behar diogu, hau da murriztu behar ditugu termino teknikoen ezaugarriak. Horretarako dauden hiztegi teknikoetan oinarritu, eta teknika estatistikoak erabiliz, eredu nagusiak lortu behar dira. Emaitzarik ez badugu ere, eredua izen-sintagmarena baino zabalagoa izango dela susmatzen dugu. Beste aldetik, termino teknikoak hautatzerakoan barneko deklinabidekasua erabakigarria izan daiteke.
| sequence | N-N | TERM31_A3.rs3 | A3 | TERM | |
2.1. Teknika linguistikoak
Teknika linguistikoak erabiltzen dira batez ere terminoen hasierako selekzioa egiteko. Horretarako, eredu morfosintaktikoak erabili ohi direnez gero, komenigarria da testua analizaturik edukitzea edo gutxienez etiketatua. Tresna linguistikoen kalitateak baldintzatuko ditu, hein handi batean behintzat, tresnaren emaitzak. Hala ere, proiektu batzuetan ez da analisi morfologikorik edo sintaktikorik egiten (Su et al., 96).
Analisi morfologikoarekin eta desanbiguazioarekin lotuta dago lematizazioa. Flexio konplexuko hizkuntzetan hitz-forma bakarrik tratatzeak emaitza kaxkarrak ekarriko ditu eta lematizazioa ezinbestekoa izango da. Ezagumendu linguistikoa funtsezkoa da terminoen normalizazioan ere; termino batzuk beste luzeago batzuen baitan egon daitezkeenez, haien artean diskriminatu egin behar baita. | 2.2 .Teknika estatistikoak
Eredu linguistikoari jarraitzen dioten balizko terminoak murrizteko erabili ohi dira metodo estatistikoak proiektu gehienetan. Aplikatutako metodoak asko aldatzen dira proiektuaren arabera: sinpleena izango litzateke maiztasun absolutu minimo bat eskatzea (Justeson & Katz, 95), baina orokorrean formula probabilistiko anitz konbinatzen dira.
| 2.3. Emaitzak
Lortzen diren emaitzak ez dira oraindik beharko liratekeenak erauzketa zeharo automatikoa egiteko. Oreka bilatu behar da estaldura (recall) eta doitasunaren artean (precision). Oreka horretan estaldurari lehentasuna ematen zaio atzetik terminologia murrizteko pertsona bat badago. % 95 inguruko estaldura lortzeko doitasuna % 50-era jaitsi ohi da, eta doitasuna % 85 ingurukoa izan dadin estaldura % 35era ere ez da iristen.
| sequence | N-N | TERM31_A3.rs3 | A3 | TERM | |
Key words are extracted from parsing such definitions so that literal translation of English key words into Chinese can be achieved. | Then the Chinese key word translations are processed in the coiner making use of Chinese morpheme database and Chinese word formation rules.
| secuencia | N-N | TERM32_A1.rs3 | A1 | TERM | |
Las palabras clave se extraen del análisis de estas definiciones de manera que pueda llegarse a una traducción literal de las palabras clave del inglés al chino. | Seguidamente, las traducciones de las palabras clave del chino son procesadas en el acuñador haciendo uso de la base de datos relativa a los morfemas en chino y de las reglas para la formación de palabras en chino. El resultado será una serie de traducciones alternativas para que personas expertas puedan escoger.
| sequence | N-N | TERM32_A2.rs3 | A2 | TERM | |
Definizio horien egitura-azterketatik gakohitzak ateratzen dira, txinerara hitzez-hitzezko itzulpena egin ahal izateko. | Gero, txinerazko gako-hitzen itzulpenak asmatzailean prozesatzen dira, txinerazko morfemen datu-baseak eta txinerazko hitz-eraketarako arauak erabiliz.
| Ondorioa itzulpen alternatiboak izango dira, gizaki adituek aukera dezaten.
| sequence | N-N | TERM32_A3.rs3 | A3 | TERM | |
baina askotan, jatorria eta izaera erreferentziala nahasi | eta zaku berean sartzen dira erabat predikatiboak diren izenondoak, zalantzarik gabe erreferentzial hutsak diren izenondoekin.
| sequence | N-N | TERM34_A3.rs3 | A3 | TERM | |
terms are generated in English | and come in as loanwords.
| secuencia | N-N | TERM38_A1.rs3 | A1 | TERM | |
los términos se generan en inglés | y penetran como préstamos en aquellas.
| sequence | N-N | TERM38_A2.rs3 | A2 | TERM | |
terminoak ingelesez sortzen dira, | eta mailegu moduan sartzen dira beste hizkuntzetan.
| sequence | N-N | TERM38_A3.rs3 | A3 | TERM | |
espezialitateko eremuaren mugak gainditzen dituela Interneteko terminologiak (espezialitatera mugatzen da, definizioz, lexiko zientifiko eta teknikoa), | eta erabilera orokorreko hizkeran sartzen dela indartsu;
| sequence | N-N | TERM38_A3.rs3 | A3 | TERM | |
The paper I wish to present at the International Congress on Terminology is based on the contents of a report commissioned by the Directorate for Studies and Information of the Linguistic Policy Department of the Basque Government. This report was presented at the first meeting of the Special Committee for Toponymics, dependent on the Advisory Board for the Basque language in Donostia-San Sebastián in November last.
The need to standardise geographical terms, especially toponymic terms, arose during work to standardise place names in the Basque Autonomous Community (BAC), which has been going on at the DEIKER Institute at the University of Deusto for the last ten years.
The lack of geographical standardisation in the BAC and Navarre can be seen in the anarchical way in which everyday geographical terms are used in maps, road signs, text books, the media, etc. Each user applies their own criteria to geographical terms, giving rise to confusion and inconsistencies.
The first UN conference on the standardisation of geographical names (held in Genoa in 1967) recommended the drawing up of glossaries of geographical terms.
Recommendation 19A of the conference recommended that a study be undertaken into the nature of the geographical features bearing names in a particular region, and the different meanings of the words used to name those features.
Before looking in detail at the different areas to be dealt with in the paper, we must define what a toponym is. A toponym or geographical name is a proper noun made up of a specific element and, usually, a common or generic element. The latter indicates the general nature of the geographical feature while the former specifically identifies the individual feature in question. Examples would be Peña de Anboto, Avenida Ramón y Cajal, RÃo Ibaizabal, Alto de la Horca, etc.
The above definition of a toponym reveals just how important geographical terms are, especially when it is realised that standard toponymic studies give two versions (Basque and Spanish) of each term. In general terms the generic element can be translated, while the specific one should be left unchanged. This would standardise the above terms in Basque as follows: Anbotoko atxa, Ramón y Cajal etorbidea (?), Ibaizabal, La Horca gaina (?).
However the following points require consideration:
1. We do not know the exact meaning of many generic elements: "alto" (given here in Basque as "gaina") could mean "mountain pass", "hill", "peak" or various other things.
2. "Standardised" geographical terms may be allocated arbitrarily. For instance in the district of Deusto we find avenida ("avenue") used for two thoroughfares which should not both be described thus: "Avenida Ramón y Cajal" is an ordinary street, while "Avenida Lehendakari Agirre" is a true avenue.
3. There is a lack of standardised geographical terminology. For instance the Spanish term avenida is translated into Basque variously as ibilbidea, etorbidea or pasealekua, depending on which Town Hall allocated the names. Likewise the Spanish term pico ("peak") may appear as gallur, haitzorrotza, haizpunta, mokorra, mokoa, punta, or tontorra depending on the author or research body involved (DEIKER, Elhuyar, Government of Navarra, Euskatzaindia, etc.). | After this initial presentation, the paper will continue along the following lines:
1. Analysis of the problem from the viewpoint of users of geographical terms.
2. Importance of and need for a standardisation of geographical terms as part of work to standardise toponyms. Reference will be made to the recommendations of the UN and of various specialists.
3. Summary of how geographical terms have been dealt with in toponymic standardisation work by the DEIKER institute at the University of Deusto.
4. Conclusions. Questions and answers
| sequence | N-N | TERM51_A1.rs3 | A1 | TERM | |
1.- Arazoen analisia "geografiako terminologiaren erabiltzailearen" ikuspuntutik. | 2.- Toponimia normalizatzeko lanen barruan geografiako terminologia normalizatzeak daukan garrantzia eta hori egiteko dagoen premia. Nazio Batuen gomendioak eta espezialistenak bilduko dira.
| 3.- Deustuko Unibertsitateko DEIKER Institutuak toponimia normalizatzeko lanetan termino geografikoari eman zaion tratamendua laburbilduko da.
| 4.-Ondorioak. Galderak eta iradokizunak.
| sequence | N-N | TERM51_A3.rs3 | A3 | TERM | |
Komunikazioan landuko ditugun alderdiak zehaztu baino lehen, toponimo kontzeptuaren definizioa emango dugu, geografiako terminoarekin duen loturari dagokionean.
Definizioz, toponimoa edo izen geografikoa hauxe da: "izen propio bat da, eta osagai espezifiko bat dauka, eta gehienetan, baita osagai komun edo orokor bat ere. Entitate geografikoaren izaera orokorrean hartuta identifikatzen du azken osagai horrek, eta osagai espezifikoak, aldiz, modu partikularrean identifikatzen du".
Esate baterako, Peña de Anboto, Avenida Ramón y Cajal, RÃo Ibaizabal, Alto de la Horca... Toponimo definizioa bera da termino geografikoaren garrantzia ikusarazten diguna; are gehiago, toponimoen normalizazio lanetan bi bertsio proposatzen direla kontuan hartzen bada (euskara eta gaztelera). Horrek esan nahi du, hala, oso goitik hartuta, osagai orokorra itzuli egin daitekeela, eta osagai espezifikoa bat ere aldatu gabe utzi behar dela.
Adibidez, goian aipatutako toponimoak honela normalizatuko lirateke euskaraz: Anbotoko atxa, Ramón y Cajal etorbidea (?), Ibaizabal, La Horca gaina (?). | Jarraian zenbait gogoeta puntu aipatutako ditugu eskuetan darabilgun gai honen gainean:
1.- Ez dugu ezagutzen osagai orokor askoren esanahi zehatza: "alto", "gaina" (bortua, mendia, gailurra...).
2.- "Normalizatutako" termino geografikoa edonola esleitzen da: adibidez, Deustuko auzoan bi "etorbide" aurkitzen dira, eta egia esan, ez lukete termino bera eduki behar: Avenida Ramón y Cajal (kalea) eta Avenida Lehendakari Agirre (etorbidea).
3.- Ez dago geografiako terminologia normalizaturik: adibidez, "avenida" terminoa itzultzeko "ibilbidea", "etorbidea", "pasealekua" etab. erabiltzen dira, udal bakoitzaren arabera, edo "pico" itzultzeko, "gailur", "haitzorrotza", "haizpunta", "mokorra", "mokoa", "punta", "tontorra"... ikerketa egin duen pertsonaren edo erakundearen arabera (DEIKER, Elhuyar, Nafarroako Gobernua, Euskaltzaindia...).
| Aurkezpen horren ondoren, komunikazioak gai hauek hartuko ditu:
1.- Arazoen analisia "geografiako terminologiaren erabiltzailearen" ikuspuntutik.
2.- Toponimia normalizatzeko lanen barruan geografiako terminologia normalizatzeak daukan garrantzia eta hori egiteko dagoen premia. Nazio Batuen gomendioak eta espezialistenak bilduko dira.
3.- Deustuko Unibertsitateko DEIKER Institutuak toponimia normalizatzeko lanetan termino geografikoari eman zaion tratamendua laburbilduko da.
4.-Ondorioak. Galderak eta iradokizunak.
| sequence | N-S | TERM51_A3.rs3 | A3 | TERM | |