Un sistema de ‘machine learning’ para tapar los despistes de Wikipedia

Un sistema de ‘machine learning’ para tapar los despistes de Wikipedia

La gran enciclopedia moderna no siempre hace justicia a decisivas contribuciones de la comunidad científica. El objetivo de Quicksilver es poner fin a estos descuidos

Quicksilver hace lo mismo que un humano. Si los humanos pudieran leer 500 millones de noticias, 39 millones de papers, toda la Wikipedia y acto seguido, escribir 70.000 resúmenes biográficos. Todo ello, claro, sin morir en el intento, como los antiguos maestros constructores que, que estiraban la pata antes de ver terminada su catedral.

¿Qué hace Quicksilver? Justicia. Este sistema, desarrollado por Primer, una compañía especializada en aprendizaje automático y afincada en San Francisco, tapa agujeros. De 30.000 informáticos -identificados por Primer- que contribuyen activamente a la investigación científica en su campo, sólo un 15% son conocidos para Wikipedia. "Las fuentes de conocimiento generadas por humanos tienen un problema. Hay artículos que deberían estar, pero están completamente ausentes. Son los desconocidos desconocidos", explica John Bohannon, director de ciencia de Primer, en un post dedicado a Quicksilver.

  • Algunas olvidadas

Bohannon pone los ejemplos de Joelle Pineau, la canadiense que dirige el laboratorio de investigación en inteligencia artificial de Facebook en Montreal; o Miriam Adelson, activa investigadora en tratamientos de adicción; o Evelyn Wang, jefa del departamento MechE, del MIT, entre cuyas contribuciones figura un dispositivo capaz de generar agua potable a partir de luz solar y aire del desierto. "Hace unos días, ninguna de ellas tenían artículos en Wikipedia, pese a que deberían", asegura.

Wikipedia va muy por detrás de las noticias sobre personas y eventos

Sin embargo, el director de ciencia de Primer no encontró estas lagunas por sí mismo. Lo hizo con la ayuda de Quicksilver. El sistema está entrenado con 30.000 entradas de Wikipedia dedicadas a científicos y más de 3 millones de frases de distintos documentos describiendo a estas personas y sus trabajos. "Entonces, introdujimos los nombres de 200.000 autores de estudios científicos, y a la mañana siguiente descubrimos que faltaban 40.000 personas".

  • Otras lagunas

Además, Quicksilver reveló que incluso en las 30.000 entradas que había empleado para su entrenamiento faltaba información relevante. "Crear un artículo en Wikipedia es sólo el principio. Tiene que mantenerse y actualizarse para siempre, mientras el mundo cambia", señala Bohannon. "Wikipedia va significativamente por detrás de las noticias sobre personas y eventos"

¿Funciona? Eso parece. Incluso antes de haber completado su desarrollo, el proyecto se puso a prueba en tres editathones -maratones de edición- de Wikipedia, convocados para mejorar la cobertura de las mujeres en ciencias. Además, para probar sus avances, Primer ha publicado una lista de 100 científicos detectados con Quicksilver, con una breve descripción generada por el sistema y señalando también el número de eventos, menciones y documentos asociadas a cada uno."Con las manos humanas vienen las limitaciones humanas. Mientras Wikipedia se vuelve más y más esencial para el mundo, la información sesgada o ausente tendrá un mayor impacto", vaticina Bohannon.

Retina

19/10/2018
El chatarrero electrónico que acabará en la cárcel
09

El chatarrero electrónico que acabará en la cárcel

Eric Lundgren irá a prisión por desafiar a Microsoft. Pero antes ha tenido tiempo de fabricar un coche eléctrico con desechos que supera al Tesla y ha librado de plomo y mercurio a los trabajadores de los basureros electrónicos de Ghana.

En la guarida barcelonesa de Amazon
10

En la guarida barcelonesa de Amazon

Las oficinas barcelonesas del gigante de la distribución incluyen un centro de I+D enfocado al análisis semántico y son una Torre de Babel en la que manda el silencio.

Normas