Acceder al contenido principalAcceder al menú principal

Logo de la UAMUniversidad Autónoma de Madrid

Acceso al BOUAM. Enlace externo. Abre en ventana nueva.

Más artículos

“Los procesos de difusión de las epidemias se ven muy afectados por las estructuras de comunidades”: Inmaculada Gutiérrez García-Pardo

25/02/2021
Foto de la investigadora Inmaculada Gutiérrez García-Pardo

Inmaculada Gutiérrez García-Pardo | Foto cedida por la investigadora

La matemática Inmaculada Gutiérrez comparte en esta entrevista su visión sobre la Ciencia de Datos, y nos presenta su trabajo en la detección de comunidades a través de las redes sociales, además del papel que juegan esas estructuras en el estudio de la difusión de epidemias como la presente.

 

Por Alicia Fernández

 

Inmaculada Gutiérrez García-Pardo, apasionada de las matemáticas y de la ciencia de datos, nos recibe por videoconferencia en el salón de su apartamento en Lisboa. Graduada en matemáticas y doctoranda en Ciencia de Datos en la Universidad Complutense de Madrid, espera poder entregar su tesis a principios de 2021. Las técnicas de su estudio podrían tener múltiples aplicaciones, incluyendo el desarrollo de modelos sobre la expansión de enfermedades contagiosas.

 

Pregunta: Ciencia de datos es una expresión que se oye mucho últimamente, junto a otras expresiones como big data o machine learning. Se dice que la profesión del futuro es la de científico de datos. ¿Qué es la ciencia de datos y por qué se ha vuelto tan importante?

Respuesta: La ciencia de datos es el manejo de un gran volumen de datos, su análisis y la comparación de técnicas y métodos para sacar provecho de la información. Se ha vuelto tan importante porque cada vez generamos más datos, y para poder aprovecharlos es importante contar con herramientas que nos permitan poder manipularlos. Si no se dispone de buenos métodos es imposible controlar y saber qué hay detrás de la información.

 

Pregunta: Pronto presentará su tesis, Detección de comunidades en redes sociales basada en medidas borrosas. ¿En qué ha consistido?

Respuesta: Se trata de tratar de encontrar grupos conectados en grafos de redes complejas. Para nosotros las redes sociales son algo más amplio que Facebook y LinkedIn; son conjuntos de elementos que están conectados entre sí de alguna manera, bien porque se relacionan, bien porque tienen ciertas sinergias entre ellos… Lo que hemos desarrollado para mi tesis ha sido el problema de detección de comunidades, encontrar estos grupos de individuos que están muy conectados, que presentan muchas similitudes entre sí… Y eso se hace con métodos de clúster.

 

Pregunta: Los métodos de clúster requieren una medida de similitud. Para determinar que alguien es cercano a alguien o que pertenece a una comunidad concreta hay que definir antes un criterio de cercanía, ¿no es cierto?

Respuesta: Efectivamente, esa es una de las partes más importantes, porque si no modelas bien, difícilmente se obtendrá un resultado coherente con la situación que se está abordando. Este concepto de qué es similitud, o incluso qué es no-similitud [porque podemos saber qué elementos tienen que estar agrupados, pero podríamos conocer cuáles no tienen que estar agrupados] dependen mucho del problema que se esté tratando: podemos hablar de relaciones familiares, relaciones vía Twitter… Por ejemplo, usuarios que se retuitean, que se marcan favoritos, que se mencionan… También se pueden usar relaciones de tipo sentimental. Todo este tipo de interacciones se traducen en forma de similitudes.

 

Pregunta: ¿Qué dificultades se han encontrado al estudiar comunidades en redes sociales?

Respuesta: ¡Todas! Para enfrentarte a estos problemas hay que ser hábil con el tratamiento de volúmenes grandes de datos, una de las partes más importantes es conseguir una buena representación del problema para poder obtener resultados coherentes. Más allá de esto, en el estudio de la estructura de comunidades de una red social, es esencial tener en cuenta qué tipo de grupo queremos encontrar, que dependerá del criterio que se considere.

Hemos tenido en cuenta distintas fuentes de información con respecto al mismo conjunto de datos, y estas fuentes de información son independientes entre sí, porque que un usuario en Twitter retuitee a otro no quiere decir que tengan la misma ideología política, o que estén físicamente cerca, o que tengan los mismos seguidores; es importante elegir cómo agregamos esta información, porque podemos tener mucha, pero hay que organizarla y decidir qué importa y qué no, y cómo combinar todo para finalmente aplicar el proceso de agrupamiento, que es el último punto.

 

Pregunta: ¿Qué aplicaciones puede tener este estudio?

Respuesta: La organización en comunidades de una red social es un proceso importante previo al análisis, porque permite simplificar notablemente la estructura, lo que va a facilitar la posterior explotación de la información. Conocer esta estructura de comunidades desvela la existencia de organizaciones internas que no son triviales ni se pueden adivinar a priori; a partir de estas organizaciones se pueden inferir relaciones especiales. Se pueden comprender mejor los procesos dinámicos que suceden en las redes, por ejemplo, los procesos de difusión de las epidemias se ven muy afectados por las estructuras de comunidades, el análisis de la pandemia es uno de los ejemplos más evidentes de cómo se ha tratado de encontrar grupos de personas que se relacionan entre sí.

 

Pregunta: Estamos dando muchísimos datos permanentemente, todos llevamos un móvil en el bolsillo, aspiradoras que aspiran solas y mapean nuestra casa… ¿Cómo mantener ese equilibrio entre la información que lanzamos, muchas veces sin darnos cuenta, y la privacidad?

Respuesta: Aquí creo que hay que diferenciar entre las cosas que hacemos sin darnos cuenta como por ejemplo llevar un móvil en el bolsillo y no ser conscientes de que estamos emitiendo información y lo que publicamos en una red social. Lo que más se puede controlar, porque nadie va a dejar de llevar un móvil ni de usar internet, son las publicaciones o la visibilidad en redes sociales. Es algo muy personal, pero lo más importante es ser consciente del alcance que esta información puede tener, porque cualquier huella nuestra en Internet va a haber un analista que la va a utilizar para algo. Nos sorprendemos cuando buscamos un producto y a los treinta segundos nos llega publicidad sobre otro muy parecido, y lo preocupante es que eso nos siga sorprendiendo, cuando esta dinámica de análisis de datos es una realidad. Creo muy necesario que haya concienciación sobre lo que generamos y lo que emitimos.

 

Pregunta: Las matemáticas son muy útiles y sin embargo suelen ser la asignatura hueso, tanto en el instituto como a nivel universitario. ¿Qué se puede hacer para mejorar su imagen?

Respuesta: Para mí uno de los puntos clave es la labor del profesor. Estudiar matemáticas exige una capacidad de abstracción que no hace falta con cualquier otra asignatura. Esa necesidad de abstraerse hace que se encasille como asignatura difícil. Igual podría funcionar presentar las matemáticas como una herramienta útil para la vida, no para ir al supermercado y saber hacer cuentas. Las matemáticas no tienen nada que ver eso; facilitan tener un espíritu crítico y analizador para cualquier cosa, y mejoran la capacidad de argumentar. Habría que encontrar cómo presentarlas de una manera atractiva desde primaria, para que los alumnos no piensen esto es muy difícil y no me va a servir para nada. ¿Cómo hacerlo? Yo no lo sé, no sé cuál es la clave, pero los métodos que hay ahora no son del todo amigables con las matemáticas y menos aún con la estadística.

 

 

___________________

Alicia Fernández es licenciada en Matemáticas por la Universidad Autónoma de Madrid (UAM) y máster en Estadística Aplicada y Estadística para el Sector Público (Universidad de Alcalá, UAH). Lleva más de 10 años trabajando en el ámbito de la estadística pública y en la actualidad es estudiante de posgrado del Título de Experto en Comunicación Pública y Divulgación de la Ciencia de la UAM.