Big data (macrodatos), migración y movilidad humana
El término "macrodatos" (big data, en inglés) comprende datos anonimizados generados por usuarios de dispositivos móviles y plataformas de internet, o por sensores y medidores digitales, como las imágenes satelitales. Con aproximadamente 5.160 millones de usuarios únicos de dispositivos móviles y alrededor de 4.570 millones de usuarios de internet activos en todo el mundo (We Are Social y Hootsuite, 2020), estos "rastros digitales" ofrecen una gran oportunidad para complementar las fuentes tradicionales de datos sobre migración y ampliar los conocimientos sobre diversos aspectos de este fenómeno. Ello es tanto más importante en vista de la actual carencia de datos y de la necesidad de supervisar los avances realizados hacia la consecución de las metas de los Objetivos de Desarrollo Sostenible (ODS) relacionadas con la migración. Sin embargo, las posibilidades que ofrecen estas innovadoras fuentes de datos conllevan dificultades considerables.
Back to top
Definiciones
En términos generales, big data se definen como datos generados automáticamente por usuarios de teléfonos móviles, medios sociales, o plataformas y aplicaciones de internet, así como por sensores y medidores digitales. Estos datos se almacenan en tiempo real en grandes bases de datos, que a menudo pertenecen a empresas privadas, ya sean operadores de telefonía móvil o proveedores de plataformas de medios sociales u otros servicios de internet. Sin embargo, los big data se consideran "macro" no solo por su volumen; la rapidez ("velocidad") con la que se generan y la complejidad ("variedad") de la información que ofrecen sino también por ser rasgos distintivos de este tipo de datos (Hilbert, 2013).
A diferencia de los datos basados en las tradicionales encuestas de hogares, big data no se derivan de una muestra aleatoria de personas, sino de la totalidad de la población que utiliza, por poner un ejemplo, teléfonos móviles o plataformas de internet, y son accesibles en tiempo real (Hilbert, 2014). Los big data también se diferencian de los datos tradicionales en la medida en que requieren métodos técnicos y analíticos específicos para extraer información significativa y transformar los datos en "valor" (de Mauro, Greco y Grimaldi, 2016). Letouzé (2015) distingue entre big data entendidos como datos o como una traducción "digital" de las acciones, interacciones y transacciones humanas registradas por dispositivos y servicios digitales, y big data como "ecosistema[s] de datos, capacidades humanas y técnicas, y comunidades" que generan información a efectos de la toma de decisiones.
Avances recientes
En los últimos años, un creciente número de proyectos y aplicaciones han puesto de manifiesto las posibilidades que ofrece la utilización de diversos tipos de fuentes de big data —como los teléfonos móviles, los medios sociales o los datos satelitales— para adquirir una mejor comprensión de los fenómenos relacionados con la migración mundial y la movilidad humana. El escepticismo inicial –incluso entre la comunidad de estadísticos (Grupo de Trabajo Mundial de las Naciones Unidas sobre los Big data en las Estadísticas Oficiales, 2016)– ha dado paso al reconocimiento del valor de estas innovadoras fuentes de datos para complementar las tradicionales fuentes de datos y metodologías estadísticas sobre migración. La innovación basada en datos, en particular en big data, es actualmente objeto de estudio por diversos equipos de tareas y grupos de trabajo (Ibid., 2020; Equipo de Tareas sobre Big data de Eurostat, 2020; Pulso Mundial de las Naciones Unidas, 2020) y se menciona en los principales marcos mundiales sobre políticas migratorias, como el Pacto Mundial para la Migración Segura, Ordenada y Regular.
La alianza Big Data for Migration (Big data al Servicio de la Migración - BD4M, por sus siglas en inglés) —una iniciativa conjunta del Centro de Análisis de Datos Mundiales sobre Migración de la OIM y el Centro Común de Investigación de la Comisión Europea— ha comenzado a reunir muchos de los proyectos pioneros en este ámbito a través del Directorio de Innovación de Datos. En cooperación con varios asociados internacionales, el Directorio ofrece información actualizada sobre proyectos, iniciativas y aplicaciones de nuevas fuentes de datos y metodologías innovadoras en materia de migración y movilidad humana, a fin de facilitar el acceso a los conocimientos existentes en este ámbito de rápida evolución. Entre los ejemplos más destacados se encuentran los siguientes:
- Los registros de llamada de teléfonos móviles sirven para realizar un seguimiento de los desplazamientos internos causados por desastres naturales, como el terremoto de Nepal, o la propagación de enfermedades, como la COVID-19 (Wilson et al., 2016; Flowminder y Servicios Estadísticos de Ghana, 2020; Pepe et al., 2020). Aunque los registros de llamada normalmente son más útiles para identificar patrones de migración interna, también pueden utilizarse para medir los flujos migratorios internacionales a nivel subregional, en particular si se combinan con otras fuentes. Por ejemplo, la combinación de registros de llamada y datos satelitales permite representar gráficamente los movimientos de comunidades transfronterizas (Sorichetta, 2017); los registros de llamada utilizados en combinación con estadísticas censales pueden ayudar a comprender los patrones de integración de los refugiados (Boy et al., 2019); y la utilización combinada de registros de llamada, datos geolocalizados de medios sociales y estadísticas oficiales de trabajo puede contribuir a evaluar la integración social de los migrantes en los países de destino.
- La actividad geolocalizada procedente de redes sociales como Twitter y Facebook, desglosada también por edad, sexo y nivel de competencias o sector de ocupación a partir de la información facilitada por los propios usuarios, sirve para anticipar flujos y poblaciones de migrantes internacionales (Zagheni, Kiran y State, 2014; Patel, 2017; Gendronneau, 2019). Por ejemplo, durante la pandemia de la COVID-19, los mapas de prevención de enfermedades de Facebook proporcionaron datos diarios sobre la distribución y el movimiento de las poblaciones, que a su vez permitieron realizar análisis más detallados sobre la enfermedad (Maas et al., 2020). En total, el número de usuarios activos en redes sociales en todo el mundo alcanzó en abril de 2020 los 3.800 millones (We Are Social y Hootsuite, 2020), de los cuales 2,6 millones eran exclusivamente usuarios de Facebook (Statista, 2020). La popularidad de estas plataformas, junto con la información geoetiquetada que es posible extraer de ellas, puede aprovecharse para estudiar los patrones de movilidad.
- Los datos de los medios sociales también pueden utilizarse para obtener en determinado momento información de alcance nacional o mundial como si se tratase de un "censo en tiempo real" (Zagheni, Weber y Gummadi, 2017; Spyratos et al., 2019). Los datos de la plataforma publicitaria de Facebook, por ejemplo, pueden ofrecer información sobre determinadas características de los usuarios (proporcionadas por ellos mismos), como su edad, sexo, "localidad natal" y país de residencia actual, formación académica, sector de ocupación e intereses personales. A principios de 2018, Spyratos et al. pudieron detectar con precisión el incremento en el número de migrantes venezolanos presentes en España (el número de usuarios activos al mes considerados por Facebook como "expats"), una tendencia que confirmaron las estadísticas oficiales de este país. Asimismo, el contenido de los medios sociales puede utilizarse para analizar la percepción de la población respecto de los migrantes y los refugiados y el modo en que se polarizan las opiniones en los medios sociales (Natale, 2017; Pulso Mundial de las Naciones Unidas y ACNUR, 2017).
- Las conexiones reiteradas a un mismo sitio web y las direcciones IP de las actividades de envío de correos electrónicos sirven para realizar estimaciones sobre los patrones de movilidad internacional y la probabilidad de que los usuarios se trasladen a otros países (Zagheni y Weber, 2012; State et al., 2013). La información proporcionada por los usuarios sobre su sexo y edad también ha permitido calcular las tasas de migración por sexo y edad. Los datos de las búsquedas en línea también pueden contribuir a prever los flujos de migración (forzosa) como lo demuestran los proyectos que comparan los datos de Google Trends y las cifras relativas a las llegadas de solicitantes de asilo y migrantes a Europa y Australia (Connor, 2017; Pulso Mundial de las Naciones Unidas, 2014). De manera similar, es posible utilizar el índice de Google Trends —que se obtiene a partir del motor de búsqueda de Google, utilizado por millones de personas en todo el mundo— para analizar términos de búsqueda relacionados con la migración, a fin de medir la intención de migrar en un determinado país y prever los subsiguientes flujos de emigración (Böhme, Gröger y Stöhr, 2018). El sistema de alerta temprana y preparación (EPS, por sus siglas en inglés) de la Oficina Europea de Apoyo al Asilo utiliza una combinación de datos de Google Trends y fuentes de datos tradicionales para detectar cambios en los países de origen y prever las solicitudes de asilo en la Unión Europea.
- La inteligencia artificial y el aprendizaje automático pueden utilizarse de diversas maneras en proyectos y aplicaciones a fin de comprender mejor los fenómenos relacionados con la migración. Por ejemplo, el Proyecto Jetson del ACNUR utiliza la inteligencia artificial para generar un índice que permite realizar predicciones a corto plazo sobre los flujos de migrantes en Somalia sobre la base de variables básicas, como el precio de mercado de los productos básicos, las precipitaciones y la prevalencia de conflictos violentos. Asimismo, la inteligencia artificial puede complementar y reforzar los conocimientos humanos sobre interpretación de imágenes satelitales para identificar desplazamientos internos o daños en infraestructuras después de un desastre natural (Quinn et al., 2018). En Uganda, se recabaron y analizaron contenidos radiofónicos mediante el aprendizaje automático para comprender la actitud que adopta la población ante los refugiados presentes en el país (Quinn e Hidalgo-Sanchez, 2017).
Fuentes de datos
Las fuentes de big data que se han empleado hasta ahora en los estudios relacionados con la migración pueden agruparse en tres categorías principales (Grupo Mundial sobre Migración, 2017):
- Basadas en teléfonos móviles, por ejemplo, registros de llamada o transferencias de dinero móvil.
- Basadas en internet, por ejemplo, medios sociales o motores de búsqueda.
- Basadas en sensores, por ejemplo, datos del Sistema de Observación de la Tierra (imágenes satelitales).
En siguiente infografía se muestran los diferentes tipos de fuentes de datos.
Las ventajas de la utilización de las nuevas fuentes de datos para analizar aspectos relacionados con la migración están vinculadas a la posibilidad de subsanar algunas de las deficiencias que presentan las fuentes de datos y los métodos tradicionales. A pesar de los avances logrados por los gobiernos nacionales y la comunidad internacional en el ámbito de las estadísticas sobre migración, las fuentes de datos tradicionales presentan limitaciones inherentes: en efecto, los censos nacionales son costosos y poco frecuentes, resulta difícil que los migrantes participen en las encuestas de hogares y es posible que los registros administrativos subestimen el número de migrantes si estos no disponen de acceso a servicios en el país de acogida. La creciente disponibilidad de registros digitales ofrece una oportunidad para colmar las lagunas de conocimiento existentes en materia migración y movilidad, especialmente gracias a su inmediatez, la frecuencia con que permiten actualizar la información, su amplia cobertura (se incluyen todos los usuarios de dispositivos móviles y plataformas de internet) y el nivel de detalle que pueden proporcionar.
Big data pueden resultar particularmente útiles para estudiar los patrones de migración temporal o circular, que resultan difíciles de medir a través de fuentes y métodos tradicionales, o anticipar las tendencias de migración. También pueden servir para realizar un seguimiento más inmediato de la opinión pública o el discurso mediático en torno a la migración, en comparación con las encuestas de opinión pública, por ejemplo. Otra ventaja es que los datos se generan sin costos adicionales y pueden obtenerse a un menor costo, si se compara con los datos procedentes de las fuentes tradicionales, aunque depende de la voluntad de los titulares de datos de compartir su información y sus opiniones. La información combinada que es posible extraer de fuentes de datos nuevas y tradicionales puede aportar pruebas sobre aspectos de la migración respecto de los cuales sabemos poco, como las perspectivas de integración de los migrantes recién llegados a un país, las cambiantes formas de la migración que no encajan en la definición de migrante temporal o permanente de las Naciones Unidas o los movimientos migratorios futuros.
Las oportunidades que ofrecen big data entrañan dificultades considerables:
Cuestiones éticas y de privacidad: La utilización de datos generados automáticamente por usuarios, a menudo sin su consentimiento informado, plantea problemas de confidencialidad y ética, así como inquietudes en materia de derechos civiles, debido al riesgo de que dichos datos se utilicen con fines de vigilancia, un aspecto de particular gravedad en contextos de migración irregular y desplazamiento forzoso. Así pues, se impone la necesidad de crear marcos legislativos y reglamentarios adecuados para salvaguardar la confidencialidad de la información y garantizar el uso ético de los datos. En 2019, la UNESCO acometió un proceso de dos años encaminado a elaborar un instrumento normativo mundial sobre la ética en la inteligencia artificial. Asimismo, la Agencia de los Derechos Fundamentales de la Unión Europea está trabajando en un proyecto titulado "Inteligencia artificial, big data y derechos fundamentales", en el que se evalúan las ventajas y desventajas que conlleva en términos de derechos fundamentales el uso de la inteligencia artificial, el aprendizaje automático y big data con fines empresariales y de política pública. El objetivo del proyecto es formular directrices y recomendaciones sobre derechos fundamentales e inteligencia artificial para la elaboración de políticas. La OIM ha sido una de las primeras organizaciones internacionales en adoptar sus propios principios de protección de datos y además forma parte del Grupo Internacional sobre Responsabilidad de Datos, una red mundial de expertos y organizaciones dedicados a estudiar los principios y las normas necesarios para encauzar la revolución de los datos en el contexto de la acción humanitaria y el desarrollo sostenible. La OIM también ha prestado apoyo al Programa Signal sobre seguridad humana y tecnología de la Iniciativa Humanitaria de Harvard, en cuyo marco se elaboraron una serie de obligaciones éticas fundamentales para la realización de actividades informativas en contextos humanitarios.
Sesgo inherente de big data: Los usuarios de medios sociales o teléfonos móviles no son necesariamente representativos de toda la población. En particular, las diferencias en el acceso a internet o el uso de dispositivos móviles y plataformas de medios sociales según el nivel de desarrollo económico, el sexo, la edad y la zona urbana o rural todavía son significativas. Se están realizando investigaciones para abordar los retos metodológicos asociados con este sesgo (de "autoselección"), y los resultados obtenidos hasta el momento parecen prometedores (Spyratos et al., 2018; Zagheni, Weber y Gummadi, 2017; Hughes et al., 2016). Comprender el error de medición inherente a las fuentes de big data permite incrementar la capacidad predictiva de los modelos basados en estas fuentes y fomentar el uso razonable de big data en la toma de decisiones.
Dificultades técnicas, analíticas y jurídicas: Algunos retos se deben a dificultades relacionadas con el acceso a los datos —en manos de agentes privados o estatales— o la utilización de los datos con fines de investigación; la existencia de infraestructuras y sistemas de gestión de datos y seguridad inadecuados; y dificultades metodológicas para dar significado a volúmenes de datos grandes, complejos y "ruidosos". También existen cuestiones relacionadas con la continuidad de los datos, habida cuenta del raudo ritmo de cambio e innovación tecnológicos, así como dificultades para hacerse una idea general acerca de las fuentes de big data o de los métodos innovadores que pueden aportar información valiosa para la formulación de políticas, debido a la proliferación de aplicaciones experimentales y la ausencia de servicios sistemáticos en este ámbito. En este sentido, cabe incentivar la concertación de "asociaciones público-privadas" innovadoras de colaboración e intercambio de datos, como la iniciativa "Data Collaboratives" (Verhulst, 2015), para realizar progresos en este ámbito.
Con el fin de determinar concretamente el mejor modo de aprovechar las nuevas fuentes de datos para analizar el fenómeno de la migración y formular políticas, el 25 de junio de 2018, el Centro de Análisis de Datos Mundiales sobre Migración de la OIM y el Centro de Conocimientos sobre Migración y Demografía de la Comisión Europea pusieron en marcha la alianza Big Data for Migration (Big data al Servicio de la Migración - BD4M, por sus siglas en inglés). A pesar de que las Naciones Unidas y la Unión Europea ya habían puesto en marcha iniciativas sobre innovación basada en datos con fines de desarrollo sostenible, como la iniciativa Pulso Mundial de las Naciones Unidas, el Laboratorio de las Naciones Unidas de Innovación Basada en Datos, y el Grupo de Trabajo Mundial de las Naciones Unidas sobre los Big data en las Estadísticas Oficiales, todavía no existía ninguna unidad encargada de aprovechar las nuevas fuentes de datos en el ámbito de la migración y la movilidad humana, por lo que surgió la idea de crear una alianza específica.
La alianza BD4M es una red de personas y organizaciones de diversos ámbitos cuyo objetivo es: a) investigar las posibilidades que ofrecen las nuevas fuentes de datos y la combinación de metodologías tradicionales e innovadoras para el análisis de la migración y su pertinencia para la formulación de políticas; b) garantizar el uso ético de los datos y la protección de la privacidad de las personas; c) promover y facilitar nuevas formas de asociación entre empresas, entidades públicas y comunidades científicas; y d) apoyar el aprendizaje entre homólogos, en particular facilitando el intercambio de buenas prácticas y fortaleciendo las capacidades de innovación basada en datos sobre migración. Los planes de creación de la Alianza se anunciaron poco después del taller de expertos titulado "Big Data and alternative data sources on migration: From case-studies to policy support", organizado conjuntamente por el Centro de Conocimientos sobre Migración y Demografía y el Centro de Análisis de Datos Mundiales sobre Migración de la OIM en Ispra, el 30 de noviembre de 2017. Para obtener más información sobre esta red, consulte la plataforma de la Alianza, alojada por Governance Lab (GovLab) en los servidores de la Escuela Tandon de Ingeniería de la Universidad de Nueva York.
Lecturas adicionales
Bengtsson, L. et al.
2011 Improved Response to Disasters and Outbreaks by Tracking
Population Movements with Mobile Phone Network Data: A Post-
Earthquake Geospatial Study in Haiti.
Blumenstock, J., Eagle, N. and Fafchamps, M.
2013 Motives for Mobile Phone-Based Giving: Evidence in the
Aftermath of Natural Disasters
Böhme, J., Gröger, A., and Stöhr, T.
2018 Searching for a better life: Predicting international migration with
Campo, S. et al.
2018 Signal Code: Ethical Obligations for Humanitarian Information Activities
Data-Pop Alliance
2017 Big Data and Mobility: Migration and Transportation
European Union Agency for Fundamental Rights (EU FRA)
2018 Artificial Intelligence, Big Data and Fundamental Rights
Flowminder
2017 Mobile Phone Data to Understand Climate Change and
Migration Patterns in Bangladesh
Global Migration Group
2017 Handbook for Improving the Production and Use of Migration
Data for Development (Chapter 1c Innovative data sources (mobile
phones, social media)).
Hilbert, M.
2014 Big Data for Development: A Review of Promises and Challenges
Hughes, C. et al.
2016 Inferring Migrations, traditional methods and new approaches
based on mobile phone, social media, and other big data.
Independent Expert Advisory Group on a Data Revolution for Sustainable Development
2014 A World That Counts: Mobilizing the Data Revolution for
Laczko, F. and Rango
2014 Can Big Data Help Us Achieve a “Migration Data Revolution”?
State, B. et al.
2014 Migration of Professionals to the US: Evidence from LinkedIn Data
Spyratos, S. et al.
2019 Quantifying international human mobility patterns using Facebook Network data
State, B. et al.
2014 Migration of Professionals to the US: Evidence from LinkedIn Data
Taylor, L.
2016 The Ethics of Big Data as a Public Good
United Nations Global Pulse
2014 Estimating Migration Flows Using Online Search Data
2017 Social Media and Forced Displacement: Big Data Analytics &
2017 Using Vessel Data to Study Rescue Patterns in the
Zagheni, E., Kiran, V.R. and State, B.
2014 Inferring International and Internal Migration Patterns from
Zagheni, E. and Weber, I.
2012 You Are Where You E-mail: Using E-mail Data to Estimate
Zagheni, E., Weber, I., and Gummadi, K.
2017 Leveraging Facebook’s Advertising Platform to Monitor Stocks