Por Adela Mac Swiney González

Madrid, España.- La Real Academia Española (RAE) y Amazon Web Services (AWS) presentaron hoy aquí la herramienta de análisis del español que han creado conjuntamente y que permite examinar, en muy poco tiempo y mediante sistemas de inteligencia artificial, decenas de miles de documentos de Internet a la vez con el fin de valorar el estado del español en el mundo.

Este sistema, desarrollado a partir de las tecnologías nativas de la nube de AWS y con el asesoramiento de la RAE, servirá como barómetro de distintos parámetros y será la base para la recopilación de datos masivos.

En su primera versión beta, la herramienta contiene ocho millones 745 mil 563 documentos de España y todos los países hispanohablantes de América. Por el momento, sus fuentes se centran en el español digital espontáneo actual, especialmente el propio de textos informales obtenidos de redes sociales, foros o plataformas de venta en línea, pero también se ha incluido una representación de textos periodísticos para poder observar las diferencias entre un tipo de lenguaje y otro.

Actualmente, está dividida en tres grandes bloques que incluyen el estudio de extranjerismos, detectando su proporción en los textos; el análisis de la riqueza léxica, midiendo la diversidad de palabras a través del sistema MTLD (del inglés measure of textual lexical diversity ‘medida de la diversidad léxica textual’), y un radar de errores lingüísticos que los identifica y clasifica como ortográficos, gramaticales, léxicos, de estilo y tipográficos. Se han integrado reglas extraídas de obras normativas de la RAE.

De acuerdo con la RAE, el desarrollo de esta herramienta permitirá, entre otras acciones futuras, el análisis de la claridad del lenguaje administrativo, la comparación de calidad del español por épocas o la detección de errores comunes en asistentes de voz y otros dispositivos de Inteligencia Artificial (IA).

La colaboración entre la RAE y AWS se enmarca en el proyecto Lengua Española e Inteligencia Artificial (LEIA). La acción busca aplicar la IA al idioma español para hacer un análisis de su situación actual, cuidar su uso y velar por la unidad de esta lengua en todos los ámbitos, especialmente en el digital.

(LectorMx)