La palabra hecha texto: 24 horas con el trascriptor instantáneo de Google

La palabra hecha texto: 24 horas con el trascriptor instantáneo de Google

Probamos el Transcriptor instantáneo de Google, o cómo poner en negro sobre blanco las conversaciones y todo cuanto sucede a nuestro alrededor

Nada más tedioso que convertir nuestras conversaciones en textos. Este es el inconveniente que pretende sortear la aplicación Transcripción instantánea de Google. Aunque su función original es otra: nace de la unión del gigante tecnológico y la Universidad de Gallaudet (Washington, EE UU), especializada en crear herramientas de aprendizaje para las personas con dificultades auditivas. Lo probamos un día entero.

  • Mañana

El mecanismo es sencillísimo: solo con acceder a ella ya se inicia la transcripción. En la dura vida del trabajador autónomo, las conversaciones personales brillan por su ausencia, así que aplicamos el transcriptor a la televisión. ¿Puede alguien hablar durante 24 horas? Si eres tertuliano, sí. Subimos el volumen para recoger el verbo florido de esos incasables titanes catódicos. Lo primero que observamos es que es más rápido y fiable que la caótica transcriptora que incorporan las televisiones. También, y esto es un gran punto a su favor, tiene una ortografía francamente mejor, con acentuación de pronombres incluida.

  • Mediodía

Salimos a la calle a probarlo. He aquí una de las funciones más interesantes del transcriptor: resulta sorprendente su capacidad para identificar todo tipo de sonidos más allá del lenguaje verbal. En Google lo llaman sound events, acontecimientos sonoros. En la calle nos aparecerá “claxon”, “multitud” o “viento” si, como en el día que lo probamos, se levanta el cierzo mientas hacíamos la compra. También reconoce ladridos de perros o vehículos en movimiento (aunque no distingue entre un coche y un vagón de metro).

Le cuesta diferenciar el sonido de un bar del de la multitud, pero sí produce situaciones paradójicas. A un servidor, que es un manazas, se le cayó el móvil y el transcriptor lo tradujo como “golpe en la puerta”. Desde un punto de vista escatológico, los desarrolladores aseguran que reconoce el sonido de las ventosidades. Pero la aplicación tiene un problema: precisa de wifi para funcionar correctamente. Así que, a menos que te llegue la señal al bar de debajo de tu casa o tengas la clave del establecimiento, la transcripción resultará complicada.

  • Tarde

Es de suponer que la inteligencia artificial detrás de la aplicación funciona mejor con el inglés, por cuestiones sintácticas y porque la lingüística computacional está más desarrollada en el mundo anglosajón. En español, por ejemplo, cuesta reconocer la intención enunciadora de las frases, sobre todo cuando se trata de preguntas. La aplicación funciona con 70 lenguas y se puede elegir un idioma principal y otro secundario.

Desde luego, con el español es óptima y, dependiendo del hablante, roza la perfección, pero no ocurre lo mismo con las otras lenguas del Estado. Lo hemos probado con catalán y tiene problemas evidentes, sobre todo para reconocer los diferentes dialectos: nos conectamos a TV3 y, como quiera que una de las tertulianas era mallorquina, la transcripción resultante era más propia del juego del teléfono estropeado. Cierto es que no era fácil, pues el tema en cuestión eran las ventajas e inconvenientes de los succionadores de clítoris. A este respecto, hay que señalar que la aplicación tiene una función para censurar las palabras malsonantes.

  • Noche

En la tele siguen con la matraca de la investidura y de los pactos poselectorales. Por fin, un oasis de tranquilidad llamado anuncios. De nuevo nos sorprendemos de cómo interpreta la aplicación el lenguaje no verbal. De un anuncio de colonia, tan abstracto como pueden imaginar, con caballitos alados, nubes algodonosas y mujeres y hombres ligeros de ropa se reduce a un “música clásica”.

A un servidor se le cayó el móvil y el transcriptor lo tradujo como "golpe en la puerta"

Tras horas y horas de debate, intentamos llevar las sabias palabras de nuestros amiguitos catódicos a un procesador de texto para sacar algo en claro entre tanta farfulla. Problema. La aplicación te impide exportar la transcripción. Si deseas hacerlo, deberás seleccionar el texto completo y darle al clásico “cortar y pegar”. Un pequeño pero para el hombre, un gran problema para el periodista.

  • Interfaz

La interfaz es muy simple y muy limpia: solo con acceder a ella ya se inicia la transcripción. Se puede controlar tanto el tamaño de la letra como el fondo. Por defecto transcribe en blanco sobre negro, un poco cansado para la vista, siendo preferible el negro sobre blanco de toda la vida. Un circulito azul en la esquina te marca la potencia del sonido que recibe el micrófono, de manera que puedas acercarlo más a la fuente. Un botón te permite hacer anotaciones.

  • Almacenaje y privacidad

Cada vez que se usa te marca la hora a la que se inicia la transcripción, que se archivará durante un máximo de 72 horas. Por esta razón no se informa del día en el que se produce la grabación. En teoría, ese almacenaje tan breve se debe a que Google quiere demostrar que no busca usar los datos transcritos en sus algoritmos. Asimismo, se pueden eliminar todos los archivos de manera automática siempre que se desee.

Veredicto

Es, sin duda, una gran ayuda para las personas con dificultades auditivas que mejora en mucho los transcriptores a los que estamos acostumbrados, como pueden ser los de la televisión. Sin embargo, presenta problemas para el público sin dificultades auditivas: el principal es la necesidad de tener wifi para que funcione correctamente; uno secundario —aunque no menor— es el no poder exportar directamente las transcripciones.

Retina

02/06/2020
03
¿Y si Google tiene la clave del wifi?

¿Y si Google tiene la clave del wifi?

El gigante de Mountain View entra en las casas (un poco más) para ampliar la cobertura inalámbrica y permitir un control exhaustivo de los dispositivos conectados.

Normas