¿Y si los robots que viven en nuestros móviles prescinden de Internet?

¿Y si los robots que viven en nuestros móviles prescinden de Internet?

La inteligencia artificial basada en métodos híbridos que combinan la tecnología de la nube con otra alojada en el hardware del propio terminal reducen problemas de latencia, estabilidad y privacidad.

El adjetivo “inteligente” empieza a quedarse corto para calificar a los teléfonos móviles. De momento ningún neologismo parece hacerle frente al ubicuo smartphone, aunque desde que la inteligencia artificial aterrizó en ellos, estos dispositivos han experimentado una transformación que los diferencia notablemente de los primeros modelos bautizados con este término. De hecho, los últimos lanzamientos incorporan funciones que a veces nos hacen olvidar que estamos tratando con máquinas, lo cual es precisamente uno de los objetivos de la aplicación de la robótica al móvil: conseguir una interacción más natural o humana entre los terminales y las personas.

Así lo cuenta a EL PAÍS Retina el neurocientífico cognitivo Raúl Arrabales, director de Inteligencia Artificial en Psicobótica: “Como los humanos nos relacionamos entre nosotros mediante el lenguaje -oral o escrito- y la visión -vídeo grabado o imagen en directo-, las más novedosas aplicaciones integradas en estos dispositivos giran en torno a la comprensión y generación del lenguaje y de las imágenes”. Por ejemplo, en el ámbito de la visión, los humanos decodificamos de forma natural la expresión de las emociones de nuestro interlocutor a través de los gestos de su rostro o bien identificamos a una persona porque reconocemos su cara. Así que siguiendo este planteamiento, la idea es que los móviles realicen de forma eficiente estas mismas operaciones, reconociendo automáticamente rostros en las imágenes para identificar quién es quién e incluso saber la edad, el género y las emociones que expresan las personas.

Al otorgar a un terminal móvil la capacidad para comprender y decodificar los significados que contienen los datos de audio, vídeo o imagen, la experiencia de usuario es mucho más rica y natural, lo que además favorece la aparición de nuevos servicios de valor añadido. Por ejemplo, si los móviles deducen estados de ánimo mediante el análisis de los tonos de voz (prosodia), a partir de esa información sobre nuestras emociones podrían personalizar su funcionamiento y los contenidos que ofrecen en cada momento. “Buscamos, en definitiva, diseñar dispositivos más empáticos”, señala Arrabales.

Pero para que el dispositivo móvil proporcione esos servicios propios de un robot, es fundamental apoyarse en uno de estos dos procedimientos:

Opción A. Que el dispositivo funcione como un terminal pasivo o "tonto" y se limite a enviar los datos a un servicio en la nube para luego recibir la respuesta correspondiente. En este caso, toda la inteligencia y el procesamiento requeridos se encuentran ubicados en el CPD (Centro de Proceso de Datos) del proveedor de servicios de inteligencia artificial.

Opción B. Que el dispositivo sea capaz, por sí mismo, de procesar los datos de forma inteligente, con lo cual no existe ninguna necesidad de enviar los datos por la Red.

Como es lógico, cada opción tiene sus ventajas e inconvenientes. En la opción A no hay requisitos especiales de capacidad de cómputo en el terminal y basta con tener un buen acceso a la Red. Sin embargo, existe una mayor demora en la respuesta, dado que debemos esperar el tiempo que conlleva enviar los datos, culminar el procesamiento en la nube y recibir de nuevo el resultado por la Red.

Por lo que respecta a la opción B, es preciso contar con un terminal lo suficientemente potente para realizar de forma local todo el cómputo necesario, pero si nuestro dispositivo es capaz de hacerlo, evitamos el tráfico de Red y el retardo asociado, consiguiendo una respuesta mucho más fluida.

Hasta el momento, la opción A ha sido la más común, ya que los terminales no estaban preparados para ejecutar de forma efectiva esos complejos algoritmos y el hardware idóneo para ello sólo estaba disponible en servidores y grandes centros de proceso de datos. “Sin embargo, con el auge actual de la robótica aplicada a negocios y de los servicios cognitivos están apareciendo chips para móviles orientados a realizar tareas específicas de inteligencia artificial, con lo que cada vez será más habitual contar con un terminal equipado con hardware especializado para este tipo de labores”, apunta Arrabales.

En este sentido, el pasado octubre se lanzó la gama Huawei Mate 10, una familia de smartphones que reinventa la inteligencia artificial en el móvil gracias a su chipset Kirin 970, una unidad de procesamiento neuronal (NPU) embebida en el propio procesador, lo que convierte a estos dispositivos en “los más inteligentes, seguros y veloces hasta la fecha”, según sus responsables. Richard Yu, consejero delegado del Área de Consumo de Huawei, afirma que Kirin 970 combina “el potencial de la nube con la velocidad e inmediatez de respuesta de su procesamiento nativo para inteligencia artificial”, con el objetivo de revolucionar nuestra forma de interactuar con nuestros móviles.

Lo mejor de los dos escenarios

La suma de la inteligencia artificial en la nube y la que viene de serie con el hardware del propio terminal mejora aspectos como la latencia, la estabilidad y la privacidad. Como apunta Arrabales, si el terminal únicamente recurre a servicios en la nube para estas funciones, la respuesta no sólo es más lenta, sino que también existe el riesgo añadido de que nuestros datos se transmitan a infraestructuras de terceros para ser analizados. Por lo tanto, sólo deberíamos permitir que nuestra información personal se transfiera a sistemas en los que tenemos plena confianza. El problema es que a menudo no somos conscientes de que nuestra información está siendo transportada a la nube, ni sabemos quién la procesa o almacena. “En este sentido, desde el punto de vista de la privacidad y la velocidad de respuesta, como usuarios nos interesa que nuestros datos sean analizados localmente en el terminal móvil”, señala el directivo de Psicobótica.

Sin embargo, hay que tener en cuenta que muchos proveedores de servicios tecnológicos como Google, Microsoft o Apple están interesados en tener acceso a nuestros datos, pues la calidad de sus sistemas de inteligencia artificial depende en buena medida de que sean entrenados con la información de los usuarios. Además, el procesamiento agregado de estos datos proporciona un conocimiento de mucho valor comercial. Por ese motivo, hay una presión por parte de estas compañías para que usemos servicios conectados. Aparte de los acuerdos de licencia, el pacto implícito es el siguiente: “el usuario cede sus datos personales y a cambio recibe servicios gratuitos de valor añadido”. En cierta manera, estamos pagando con nuestros datos y las compañías tecnológicas como Google convierten esa información en dinero mediante la comercialización de otros servicios como la publicidad personalizada.

“Pero la combinación de ambos escenarios ofrece más posibilidades”, según Arrabales. Se trata de intentar quedarnos con las ventajas de los dos modelos y eliminar los inconvenientes. Por ejemplo, en el caso de la visión artificial, donde los datos que hay que analizar son muy voluminosos y se generan a gran velocidad, interesa que el análisis se haga localmente en el dispositivo, porque no compensa estar enviando constantemente imágenes a la nube. Si conseguimos tener un móvil capaz de analizar por sí solo las imágenes, la experiencia de usuario será mucho mejor, más rápida y sin incurrir en un incremento de tráfico y latencia de Red. En este mismo sentido, gracias a la inteligencia artificial del Kirin 970, los Huawei Mate 10 no necesitan conectarse a Internet para realizar traducciones simultáneas en más de 50 idiomas, por lo que este servicio es mucho más rápido que con otros móviles sin que además se comprometa la seguridad del usuario.

Sin embargo, esto no implica que se dejen de enviar definitivamente datos a la nube desde los terminales. Hay que tener en cuenta que lo que interesa desde un punto de vista comercial no es la información en crudo, sino el conocimiento extraído de la misma. “Por lo tanto, si el propio terminal es capaz de aplicar algoritmos de inteligencia artificial para extraer conocimiento, como por ejemplo saber cuántas personas hay en una habitación discriminando las diferentes voces que se oyen en la señal de audio recogida por el micrófono, ese tipo de información será la que es ahora susceptible de ser enviada a la nube y usada por terceros”, puntualiza Arrabales. Todo para poder seguir ofreciendo servicios de inteligencia artificial adaptados a las necesidades concretas de cada usuario en cualquier momento.

Retina

24/09/2018
Normas