Title: Medidas de distância entre línguas baseadas em corpus. Aplicação à linguística histórica do galego, poruguês, espanhol e inglês
/ Corpus based metrics for measuring distances between languages. Application to historical linguistics of Galician, Portuguese, Spanish and English.
Where: Teleconference,
……….https://eu.bbcollab.com/guest/5b757d040d024f7b91deaaaffe3bec03
……….Faculty of informatics (UPV/EHU) Ada Lovelace room
Date: October 29, 2020, Thursday, 18:30
Author: José Ramom Pichel
Supervisors: Iñaki Alegria & Pablo Gamallo
Languages: Portuguese, mainly
Abstract:
As dúvidas sobre a classificação filogenética histórica e actual do galego e as hesitações na identificação au-
tomática da língua e na construção e concepção de tradutores automáticos, sugerem que o cálculo automático da distância entre o galego, o português e o espanhol, a partir de textos escritos reais, e um desafio interessante.
1. Pode a distância entre línguas ser medida automaticamente com base em corpus?
2. Que papel desempenha a ortografia na distância entre as línguas?
3. É possível traduzir esta distância numa única métrica robusta?
4. A distância calculada com essa métrica verifica as hipóteses dos linguistas?
Adiciona novos dados sobre hipóteses minoritárias ou controversas?
5. Será que a distância entre períodos históricos da mesma língua muda? Como?
6. A distância entre línguas muda historicamente ou é sempre a mesma?
E se mudar, esta distância entre línguas é linear?
7. Será que a distância histórica entre variantes reconhecidas da mesma língua muda?
Related publications to his PhD work:
-
Jose R. Pichel, Pablo Gamallo, Iñaki Alegria, Marco Neves (2020) A Methodology to Measure the Diachronic Language Distance between Three Languages Based on PerplexityJournal of Quantitative Linguistics.
-
José Ramom Pichel, Pablo Gamallo, Marco Neves & Iñaki Alegria (2020) Distância diacrónica automática entre variantes diatópicas do português e do espanhol Linguamática, Vol. 12 N. 1, 117–126 ISSN: 1647–0818
-
José Ramom Pichel, Pablo Gamallo, Iñaki Alegria (2019) Measuring diachronic language distance using perplexity. Application to English, Portuguese and Spanish. Natural Language Engeenering.
-
Pablo Gamallo José Ramom Pichel and Iñaki Alegria (2020) Measuring Language Distance of Isolated European Languages MDPI Information 2020, 11(4), 181 doi:10.3390/info11040181
-
José Ramom Pichel, Pablo Gamallo, Iñaki Alegria (2019) Cross-lingual Diachronic Distance: Application to Portuguese and Spanish Procesamiento del Lenguaje Natural, Revista no 63, septiembre de 2019, pp. 77-84
- P. Gamallo, J.R. Pichel, I. Alegria. 2017. From language identification to language distance. Physica A: Statistical Mechanics and Its Applications 484, 152-162.
Leave a Reply