Del 17 al 19 de mayo se realizará en Bogotá el primer Congreso Internacional de Lingüística Computacional y de Corpus. Este evento, liderado por el Instituto Caro y Cuervo -adscrito al Ministerio de Cultura- pretende ahondar en el estudio de la lengua con el apoyo de tecnologías como el Big Data y la inteligencia artificial (AI).
Pero ¿qué es la lingüística computacional? Podemos definirla como el encuentro entre los estudios lingüísticos y las interfaces hombre-máquina, que permiten sistematizar y analizar las diferentes formas y expresiones de la lengua con ayuda de múltiples herramientas tecnológicas. Se trata, entonces, de un campo interdisciplinario en el que participan lingüistas, expertos en ciencias de la computación, psicólogos, entre otros profesionales.
Además, la sistematización de los cientos de datos que arrojan las lenguas naturales o étnicas (como el chino mandarín, el español y el inglés), y sus diversos usos, permiten conformar un ‘corpus’.
¿Cómo surgió?
La lingüística computacional se inició en Estados Unidos en los años 50 bajo la necesidad de crear un traductor automático para la traducción de textos desde diferentes idiomas al inglés; especialmente porque existía el interés de crear herramientas para los conflictos bélicos que facilitaran la comunicación y permitieran descifrar mensajes ocultos en las comunicaciones de los adversarios.
Actualmente, se usa para diseñar modelos y programas para el estudio, el análisis y la imitación de la comprensión y la producción del lenguaje natural.
¿En qué consiste la programación del congreso?
Durante el congreso, se reunirán académicos del mundo interesados en la investigación y el desarrollo de la lingüística computacional, con el fin de fortalecer el posicionamiento de redes académicas y el desarrollo de investigaciones interinstitucionales en diferentes áreas de la lingüística. En Latinoamérica, países como México, Chile y Argentina llevan la delantera en la aplicación de la lingüística computacional, pero Colombia buscar ponerse al día y realizar diversos proyectos en este campo.
La programación académica se divide en ponencias y paneles de expertos en cuatro áreas: lingüística del corpus, lingüística computacional, procesamiento de lenguaje natural y lingüística aplicada. La primera tiene que ver con la conformación de bases de datos a partir de lo que arroja la lengua. Previamente, los lingüistas realizaban sus estudios con una muestra de entre 100 y 200 personas. Hoy en día, dichos estudios se basan en millones de datos obtenidos gracias a la tecnología y las posibilidades que esta nos brinda para capturar y traducir información análoga y digital.
La lingüística computacional involucra programas de inteligencia artificial en máquinas, para que estas puedan transmitir con exactitud la información que se desea. Es decir, tiene que ver con las tecnologías del lenguaje, por ejemplo, algoritmos que leen y te sugieren acciones específicas, después de haber interpretado un texto o un audio. Según los expertos, “la lingüística computacional está llevando los estudios del lenguaje a una nueva frontera: las lógicas modernas de la información y la documentación’.
Por su parte, el ejemplo más conocido de la lingüística aplicada son los diccionarios (lexicografía), para los cuales se tiene en cuenta hoy en día el concepto de ‘Funcionalismo’: las necesidades del usuario determinan el diccionario, de allí que la lexicografía haya cambiado.
Entre los ponentes internacionales más destacados se encuentran Mark Davies, profesor de linguística de Brigham Young University; Ruslan Mitkov, profesor y doctor de Wolverhampton University; Tony McErny, profesor de lengua inglesa y lingüística de Lancaster University.
¿Cómo participar?
Si deseas participar en el evento, puedes ingresar al sitio web oficial del congreso y diligenciar tu formulario de inscripción. Para los asistentes internacionales la asistencia tiene un costo de 240.000 pesos y para los asistentes nacionales es de 150.000 pesos.
Imagen: Instituto Caro y Cuervo, Pixabay.