La lingüística computacional, el campo donde se unen las ciencias y las letras
FIRMA INVITADA

La lingüística computacional, el campo donde se unen las ciencias y las letras

Cuando imaginamos laboratorios donde se desarrollan sistemas de inteligencia artificial pensamos en ingenieros y científicos. Pero pocas veces pensamos en los lingüistas, los psicólogos o incluso los filósofos. Así colaboran

La inteligencia artificial esconde a un gran número de investigadores que diariamente trabaja por continuar avanzando en este campo y añadir nuevas funciones y utilidades. Cuando pensamos en IA y Big Data, imaginamos que detrás de todos estos avances hay ingenieros, matemáticos, científicos, informáticos o programadores. Y los hay. Pero, en realidad, también son necesarios otros profesionales como los lingüistas, los psicólogos o incluso los filósofos.

Estos perfiles, que aparentemente poco tienen que ver entre sí, conforman los equipos multidisciplinares que salen a relucir al profundizar en el día a día del trabajo y la investigación de la inteligencia artificial.

Para crear instrumentos y herramientas inteligentes es imprescindible que puedan comunicarse, y es en este punto donde aparece la figura del lingüista computacional, clave en la investigación de las tecnologías del lenguaje. Según Wikipedia, la lingüística computacional es un campo interdisciplinar que se ocupa del desarrollo de formalismos que describen el funcionamiento del lenguaje natural, tales que puedan ser transformados en programas ejecutables por un ordenador. De este modo, el lingüista y los ingenieros especialistas deben transformar la información existente, tanto en voz como en texto, a un lenguaje estructurado que la inteligencia artificial pueda entender y procesar, y para el que pueda generar una respuesta. Una función en la que no solo son necesarias profesiones eminentemente relacionadas con la ciencia, sino que también resultan imprescindibles expertos en el lenguaje o el comportamiento.

Realizar la tarea de conversión de toda esa información no estructurada a datos que se puedan procesar es el gran reto del procesamiento del lenguaje natural, una de las actividades más desarrolladas de la IA. Actualmente, el PLN es una de las aplicaciones más demandadas por las empresas que necesitan procesar y sacar partido de toda la información que manejan en su día a día o que almacenan en sus archivos históricos. Tareas como la traducción automática, la detección de entidades, la recuperación de información, el análisis automático del sentimiento, la extracción de ideas principales de un texto, la detección de tendencias o el desarrollo de chatbots son de vital importancia para muchas compañías, porque les permiten escuchar y aprender de sus usuarios y su comportamiento.

Es a partir de la detección de estas necesidades cuando el lingüista, junto al resto del equipo, comienza con el proceso de transformación. El punto de partida de cualquier proyecto de PLN es el corpus, un conjunto de textos, ordenados o no, que sirven de base para cualquier análisis lingüístico o estadístico. Una de las principales tareas de los lingüistas es la anotación, sistemática y exhaustiva, que convierte el conjunto de textos en un corpus anotado. Para ello, el lingüista debe realizar sobre el texto un etiquetado preciso de cada término. Es una tarea costosa, pero imprescindible para que la IA pueda comenzar a actuar sobre esa información.

A continuación, este corpus se introduce en motores lingüísticos donde se analiza a nivel morfológico, sintáctico y semántico mediante reglas lingüísticas de distinto nivel. Por último, en una fase más avanzada, se aplican modelos de machine learning que ofrecen como resultado los textos enriquecidos de manera automática con las etiquetas correctas. Estos procedimientos permiten realizar todas esas tareas de PLN que ofrecen multitud de posibilidades a empresas, instituciones o administración pública en función de sus necesidades y sus características.

La enorme variedad de clientes permite a los lingüistas embarcarse en proyectos de PLN muy diferentes unos de otros. Desde la creación de algoritmos para entrenar a chatbots, que resuelven dudas e incidencias, a la detección de neologismos en una lengua, como es el caso del proyecto de localización de anglicismos en el uso del español en EEUU en redes sociales, llevado a cabo por el Instituto Cervantes de la Universidad de Harvard en colaboración con el Instituto de Ingeniería del Conocimiento (IIC).

Ciencia y letras, a pesar de la concepción generalizada de que son términos opuestos, avanzan mucho más rápido si trabajan en equipo. La lingüística computacional es el campo donde se ejemplifica a la perfección esta conjugación de perfiles a priori antagónicos. La IA es una tecnología imparable, que se reinventa constantemente y que trae consigo grandes avances en todos los campos. Una de las claves de este éxito es que combina equipos multidisciplinares en el que todas las ramas suman y se complementan.

Carmen Torrijos es lingüista Computacional en el IIC.

Retina

23/08/2019
06

‘Deus ex machina’

En este momento en el que los algoritmos prometen darnos todas las respuestas, debemos empezar a hacernos nuevas preguntas

‘Deus ex machina’
Normas