Master Tesia

Testu arteko koherentziazko erlazio-egitura: lehen urratsak euskaraz
Alazne Rodriguez
LaburpenaTestu bat koherente egiten duten arrazoiak ulertzea oso baliagarria da testuarenberaren ulermenerako, koherentzia eta koherentzia-erlazioak testu bat edo gehiagokoherente diren ondorioztatzen laguntzen baitigu. Lan honetan gai bera dutentestu ezberdinen arteko koherentziazko 3 Cross Document Structure Theory edoCST (Radev, 2000) erlazio aztertu eta sailkatu dira. Hori egin ahal izateko,euskaraz idatziriko gai berari buruzko testuak segmentatzeko eta beraien artekoerlazioak etiketatzeko gidalerroak proposatzen dira. 10 testuz osaturiko corpusaetiketatu da; horietako 3 cluster bi etiketatzailek aztertu dute. Etiketatzaileenarteko adostasunaren berri ematen dugu. Koherentzia-erlazioak garatzea osogarrantzitsua da Hizkuntzaren Prozesamenduko hainbat sistementzat, hala nola,informazioa erauzteko sistementzat, itzulpen automatikoarentzat, galde-erantzunsistementzat eta laburpen automatikoarentzat. Etorkizunean CSTko erlazioguztiak corpus esanguratsuan aztertuko balira, testuen arteko koherentzia-erlazioak euskarazko testuen prozesaketa automatikoa bideratzeko lehenengopausua litzateke hemen egindakoa.AbstractIt is of utmost importance to comprehend what makes a text coherent tocompletely understand it, since coherence and coherence-relations will tellwhether a text or a set of texts are coherence or not.The development ofcoherence relations is very important for natural language processing's tools, suchas information retrieval systems, automatic translation, query-based answersystems and automatic summarization. In order to provide these tools with therequired coherence relations, we will analyse and classify 3 coherence relationsfrom Cross-Document Structure (CST) (Radev, 2000) within this project. In orderto achieve our purpose, we propose a segmentation and annotation guideline oftexts with the same topic. In the foreseeable future all CST relations will beanalysed in a representative corpus, therefore this project will focus on setting thefirst steps towards Basque automatic coherence relations in cross-document texts.Bideoa:
Mikel Iruskieta
- CST, RST, erlazio-egitura, koherentzia, diskurtsoa, ideia nagusia. - relational discourse structure, coherence, discourse, main idea.