Estos ordenadores saben latín (y griego). Algunas aplicaciones de la lingüística computacional a las lenguas clásicasThose Computers Have a Knack for Latin (and Greek). Some Applications of Computational Linguistics to Classical Languages
Cristina Tur
Resumen
La lingüística del latín y el griego antiguo no se ha mostrado indiferente al desarrollo digital que caracteriza nuestro tiempo. En las últimas décadas han aparecido diversos métodos de aproximación computacional al estudio de las lenguas clásicas que suponen enormes avances, pero también entrañan retos metodológicos. En este trabajo se explicarán, en primer lugar, algunos conceptos clave de la Lingüística Computacional (LC); en segundo lugar, se mostrará cómo y para qué se pueden aplicar provechosamente métodos de análisis lingüístico automático al estudio del griego clásico y del latín; en tercer lugar, se ejemplificará cómo los modelos estadísticos empleados por la LC son capaces, sin tener propiamente ningún conocimiento lingüístico, de «leer» un texto y de arrojar luz sobre cuestiones de autoría (estilometría). Todo ello tiene como objetivo último presentar los fundamentos de algunos de los procedimientos computacionales más difundidos y reflexionar sobre su papel en el estudio de las lenguas clásicas, sobre sus ventajas como metodología, así como sobre los límites y desafíos a los que se enfrentan en la actualidad.
Palabras clave: lingüística computacional; procesamiento del lenguaje natural; minería de textos; treebanks; estilometría
Abstract
Latin and Ancient Greek linguistics have not been indifferent to the digital development that characterizes our time. In recent decades, various computational approaches to the study of classical languages have emerged, which represent enormous advances but also entail methodological challenges.
This paper will first explain some key concepts of Computational Linguistics (CL). Secondly, it will show how and why automatic methods of linguistic analysis can be profitably applied to the study of Classical Greek and Latin. Finally, it will exemplify how the statistical models used by CL are able, without having any real linguistic knowledge, to ‘read’ a text and shed light on questions of authorship (stylometry). It ultimately aims to present the foundations of some of the most widespread computational procedures and to reflect on their role in the study of classical languages, on their advantages as a methodology, as well as on the limits and challenges they face currently.
Keywords: Computational Linguistics; Natural Language Processing; text mining; treebanks; stylometry
Referencias bibliográficas
Blasco Pascual, F. J. y Ruiz Urbón, C. (2022) Análisis de textos desde la estilometría, Salamanca, Universidad de Salamanca.
Busa, R. (1980) «The Annals of Humanities Computing: The Index Thomisticus», Computers and the Humanities 14, 83–90.
Celano, G. G. A. (2019) «The Dependency Treebanks for Ancient Greek and Latin», en Berti, M. (ed.) Digital Classical Philology, Berlín, De Gruyter, 279–298, doi: 10.1515/9783110599572-016.
Eder, M., Rybicki, J. y Kestemont, K. (2016) «Stylometry with R: A Package for Computational Text Analysis», The R Journal 8, 107–121.
Fradejas Rueda, J. M. (20231), Cuentapalabras: Estilometría y análisis de texto con R para filólogos [revisión del original de 2019] Disponible en: https://aic.uva.es/cuentapalabras/ {12/7/24}.
Garzón Fontalvo, E. (coord. ed.) (2023) Verba Notata. Retos en la anotación en las lenguas clásicas, Madrid, Consejo Superior de Investigaciones Científicas.
González Caballero, I. (2021) «Estudio estilométrico del teatro latino: a vueltas con Octavia y Hercules Oetaeus de Séneca», Cuadernos de Filología Clásica. Estudios Latinos 41, 57–74, doi: https://doi.org/10.5209/cfcl.77308.
González Saavedra, B. y Passarotti, M. (2018) «Using Tectogrammatical Annotation for Studying Actors and Actions in Sallust’s Bellum Catilinae», The Prague Bulletin of Mathematical Linguistics 111, 5–28, doi: 10.2478/pralin-2018-0005.
Holmes, D. I. y Kardos, J. (2003) «Who was the Author? An Introduction to Stylometry», Chance 16, 5–8, doi: 10.1080/09332480.2003.10554842.
Luque Moreno, J. (1987) Séneca. Tragedias I, Madrid, Gredos.
Lutoslawski, W. (1898) «Principes de stylométrie appliqués à la chronologie des œuvres de Platon», Revue des Études Grecques 11, 61–81, disponible en https://www.persee.fr/doc/reg_0035-2039_1898_num_11_41_5847 {18/7/24}.
Nehrdich, S. y Hellwig, O. (2022) «Accurate Dependency Parsing and Tagging of Latin», en R. Sprugnoli y M. Passarotti (eds.) Proceedings of the Second Workshop on Language Technologies for Historical and Ancient Languages(LT4HALA 2022), Marseille, European Language Resources Association, 20–25, disponible en https://aclanthology.org/2022.lt4hala-1.3 {18/7/24}.
Pociña, A. (1997) «Épica y teatro. La primera poesía desde sus comienzos hasta el siglo I a.C.», en C. Codoñer (ed.) Historia de la literatura latina, Madrid, Cátedra, 13–62.
Ramos Guerreira, A. (1996) «El estatuto lingüístico del corpus latino: algunas precisiones», en J. A. Fernández Delgado, A. Ramos Guerreira y A. Agud, (coords.) Las lenguas de corpus y sus problemas lingüísticos, Madrid – Salamanca, Ediciones Clásicas – Universidad de Salamanca, 35–52.
Tur, C. (2022) «Metonimias y metáforas conceptuales con manus en el teatro latino», Emerita 90, 121–148, doi: https://doi.org/10.3989/emerita.2022.06.2117.
Tur, C. (2024) «Concepts that Fit in a (Roman) Hand: The Cognitive Dimension of manus ‘Hand’ in Seneca’s Figurative Language», Cognitive Linguistics studies 11, 158–179, doi: https://doi.org/10.1075/cogls.00116.tur.
Tur, C. y González Saavedra, B. (2023) «Introducción. Textos y calculadoras: los corpus de las lenguas clásicas en la era digital», en E. Garzón Fontalvo (coord. ed.) Verba Notata. Retos en la anotación en las lenguas clásicas, Madrid, Consejo Superior de Investigaciones Científicas, 15–28.
Revista
-
Sobre la revista
Página principal
-
Estatutos
Estatutos de la Revista Estudios Clásicos
-
Código ético
Declaración de buenas prácticas
-
Normas de recepción y envío
Indicaciones para envíos de artículos
-
Equipo editorial
Consejos de redacción y asesor
-
Comité de honor
Comité de honor
Información
-
Para autores
Publicar con nosotros
-
Para evaluadores
Normas para evaluar artículos
-
Para bibliotecas
Información bibliográfica
-
Contacto
Cuestiones y preguntas
Publicar en EClás
-
Envío de originales
Artículos y reseñas
-
Normas de publicación
Descarga normas en PDF
-
Estilo CSL EClás
Estilo CSL EClás
-
Índices de calidad
Bases de datos e impactos