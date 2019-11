Hace días se informó de que el Instituto Nacional de Estadística (INE) seguirá la pista de los móviles en territorio nacional para elaborar estadísticas y que, para ello, se apoyará en datos comprados a las principales operadoras telefónicas. Desde entonces han surgido noticias, artículos de opinión y comentarios en redes sociales comentando la información sobe todo haciendo referencia a la cesión de datos y, por tanto, a la salvaguardia de la privacidad de los titulares de líneas de móviles.

Esta polémica trae a primera línea dos hechos muy relevantes y positivos. Primero, la magnífica labor realizada por el INE y segundo, la concienciación general sobre los datos personales y de cómo la privacidad realmente nos importa.

Es un verdadero lujo pensar que la principal institución pública para la elaboración de estadísticas esté invirtiendo en la ampliación de los datos a explorar, y en particular, es esta tipología de datos, cuya granularidad, volumen y tecnología requerida para su explotación la hacen ser una fuente propia del entorno big data. Este caso será una verdadera “best practice” (que tanto nos gusta denominar en el sector privado) de esta nueva era de datificación en la que nos encontramos.

Además, no es un estudio puntual, aislado, sino englobado en el marco de actuación de la mayor operación estadística que se aborda en este país: el censo de población y viviendas de 2021. Este será el primer censo en el que no se entreviste a las personas, ni presencialmente ni mediante cuestionario alguno. Este tipo de nuevas fuentes de datos, junto al avance de otros registros administrativos (padrón continuo, catastro, etc.) posibilitan esta nueva aproximación, realizada por muy pocos otros países. Por cierto, toda esta aproximación metodológica viene siendo transmitida y difundida públicamente desde hace varios meses en el marco del pre-proyecto censal.

Por tanto, debemos considerar como normal y estratégicamente acertado una licitación pública para disponer de estos datos, fomentando la Economía del Conocimiento y revertiendo esta inversión en la estadística pública.

Pero es que, además de estos datos sobre movilidad cotidiana de la población con datos procedentes de telefonía móvil, el INE ya está trabajando, para diferentes fines, en la explotación de otras fuentes de datos, como los procedentes de las principales cadenas de distribución, o datos generados a través de técnicas de web scrapping.

Y llegamos entonces a ese segundo hecho relevante que ya adelantábamos, la privacidad. Por ser transparentes algunos de los titulares publicados en los medios creo que no han ayudado a la mejor de las comprensiones del proyecto, generándose multitud de opiniones en contra por la utilización de datos personales. Pero lo dicho, parece un signo de madurez las cuestiones que nos planteamos cuando conocemos proyectos de esta índole, y transmitimos el valor que realmente tienen todos y cada uno de los datos que hablan de nosotros, y que atañen a nuestra privacidad.

Y es que el INE no va a trabajar con datos personales, y sí son datos estadísticos, es decir, datos consolidados de áreas geográficas lo suficientemente pequeñas para aportar variabilidad (información) a su estudio y por otro lado para salvaguardar el anonimato de cada una de las observaciones (datos individuales) utilizados.

Es decir, el marco regulatorio actual (GDPR) no parece de aplicación en tanto que la información no guarda relación con una persona física identificada o identificable. Las técnicas analíticas actuales sobre anonimización de datos, de carácter irreversible para no permitir que la identidad sea deducida, nos hacen confiar en que los datos van a fluir entre los operadores móviles y la Administración asegurándose la privacidad de los mismos (ver recomendación al respecto de la Agencia Española Protección Datos.

Estos datos de los que venimos hablando, no son, en definitiva, más que uno de los numerosos ejemplos de “datasets” que se vienen comercializando desde diferentes tipos de empresas, y que forman esta nueva línea de negocio, evidente y lógica, alrededor de la monetización de este valor intangible y diferencial que son los datos. Por ello, es ahí donde los diferentes organismos regulatorios deben hacer valer sus competencias y velar por el cumplimiento de la actual legislación, en lo referente al tratamiento adecuado de los mismos.

Y si además, como clientes, nos surge la duda de por qué, si es el caso, se estuvieran comercializando nuestros datos para otros fines no vinculados al fin principal, debemos plantear la duda al titular de los mismos (en el caso que nos ocupa, dos de las tres operadores ofrecen la posibilidad de exclusión de los datos, y una tercera justifica que no están liberando datos personales, y sí datos estadísticos).

En definitiva, controversia la surgida que nos debe ayudar a poner en valor el trabajo en el área big data realizada por una administración pública como el INE, utilizando nuevas fuentes de información, así como la puesta de manifiesto de la preocupación que tenemos por la privacidad de nuestros datos personales, y que debemos hacer significar no solo si el último responsable de tratamiento es el INE, si no también Google, Facebook u otras empresas de esta nueva economía digital.

Daniel Ruiz Nodar es licenciado en Ciencias Matemáticas, profesor de Estadística en la Universitat Oberta de Catalunya (UOC) y Chief Data Officer (CDO)en Equifax Ibérica.