Un sistema de ‘machine learning’ para tapar los despistes de Wikipedia

Un sistema de ‘machine learning’ para tapar los despistes de Wikipedia

La gran enciclopedia moderna no siempre hace justicia a decisivas contribuciones de la comunidad científica. El objetivo de Quicksilver es poner fin a estos descuidos

Quicksilver hace lo mismo que un humano. Si los humanos pudieran leer 500 millones de noticias, 39 millones de papers, toda la Wikipedia y acto seguido, escribir 70.000 resúmenes biográficos. Todo ello, claro, sin morir en el intento, como los antiguos maestros constructores que, que estiraban la pata antes de ver terminada su catedral.

¿Qué hace Quicksilver? Justicia. Este sistema, desarrollado por Primer, una compañía especializada en aprendizaje automático y afincada en San Francisco, tapa agujeros. De 30.000 informáticos -identificados por Primer- que contribuyen activamente a la investigación científica en su campo, sólo un 15% son conocidos para Wikipedia. "Las fuentes de conocimiento generadas por humanos tienen un problema. Hay artículos que deberían estar, pero están completamente ausentes. Son los desconocidos desconocidos", explica John Bohannon, director de ciencia de Primer, en un post dedicado a Quicksilver.

  • Algunas olvidadas

Bohannon pone los ejemplos de Joelle Pineau, la canadiense que dirige el laboratorio de investigación en inteligencia artificial de Facebook en Montreal; o Miriam Adelson, activa investigadora en tratamientos de adicción; o Evelyn Wang, jefa del departamento MechE, del MIT, entre cuyas contribuciones figura un dispositivo capaz de generar agua potable a partir de luz solar y aire del desierto. "Hace unos días, ninguna de ellas tenían artículos en Wikipedia, pese a que deberían", asegura.

Wikipedia va muy por detrás de las noticias sobre personas y eventos

Sin embargo, el director de ciencia de Primer no encontró estas lagunas por sí mismo. Lo hizo con la ayuda de Quicksilver. El sistema está entrenado con 30.000 entradas de Wikipedia dedicadas a científicos y más de 3 millones de frases de distintos documentos describiendo a estas personas y sus trabajos. "Entonces, introdujimos los nombres de 200.000 autores de estudios científicos, y a la mañana siguiente descubrimos que faltaban 40.000 personas".

  • Otras lagunas

Además, Quicksilver reveló que incluso en las 30.000 entradas que había empleado para su entrenamiento faltaba información relevante. "Crear un artículo en Wikipedia es sólo el principio. Tiene que mantenerse y actualizarse para siempre, mientras el mundo cambia", señala Bohannon. "Wikipedia va significativamente por detrás de las noticias sobre personas y eventos"

¿Funciona? Eso parece. Incluso antes de haber completado su desarrollo, el proyecto se puso a prueba en tres editathones -maratones de edición- de Wikipedia, convocados para mejorar la cobertura de las mujeres en ciencias. Además, para probar sus avances, Primer ha publicado una lista de 100 científicos detectados con Quicksilver, con una breve descripción generada por el sistema y señalando también el número de eventos, menciones y documentos asociadas a cada uno."Con las manos humanas vienen las limitaciones humanas. Mientras Wikipedia se vuelve más y más esencial para el mundo, la información sesgada o ausente tendrá un mayor impacto", vaticina Bohannon.

Retina

19/12/2018
02

La empresa española que le pone voz a Alexa

Airtouch New Media se está especializando en desarrollar aplicaciones para el asistente de voz de Amazon. Un mercado nuevo y basto: todas las compañías quieren su ‘skill’.

La empresa española que le pone voz a Alexa
04

Así es pasar un día entero al lado de Siri

Apple entra en el salón con el altavoz inteligente HomePod. Y lo hace, a diferencia de sus competidores, sin pantalla, solo con un cilindro blanco que sabe contestar cuando se le dice: “Hola, Siri”

Así es pasar un día entero al lado de Siri
08

El futuro de los pagos, en cinco innovaciones

La biometría es una de las grandes apuestas tecnológicas desarrolladas por Mastercard que, junto al 'machine learning' y la 'tokenización', hacen saltar por los aires las antiguas formas de identificación y autenticación en los pagos electrónicos

El futuro de los pagos, en cinco innovaciones Ver vídeo 1 min
David Broncano: tecnología hecha chiste
10

David Broncano: tecnología hecha chiste

David Broncano, presentador de 'La resistencia', se inspira en la tecnología para sus monólogos, usa las redes para ‘trolear’ y un reloj con GPS para escalar

Normas