Buscan calibrar el sesgo de género en los datos online

La brecha de datos de género arroja que los hombres están sobrerepresentados en muchos de los datos que las organizaciones utilizan para tomar decisiones

thumb
Buscan calibrar el sesgo de género en los datos online

CIUDAD DE MÉXICO

Con el paso del tiempo el mundo ha ido cambiando drásticamente, en algunas cosas para bien, en otras no tanto. 

¿Se está diseñando un mundo para hombres? Es una pregunta que al día de hoy muchísima gente se ha cuestionado y es que la brecha de datos de género arroja que los hombres están sobrerepresentados en muchos de los datos que las organizaciones utilizan para tomar decisiones.

Para un tema sencillo, pero no lo es. Este sesgo afecta a todos los ámbtos de la vida. 

Pensando en esto Citibeats deicidió ponerse como objetivo eliminar el sesgo en los análisis de las opiniones de las personas y calibrar los resultados antes que los usuarios los utilicen. 

A partir de los datos procesados Citibeats percibió algunas diferencias en los temas de opiniones compartidas por mujeres y hombres.

Por ejemplo, en una muestra de datos en América Latina, de opiniones cívicas durante la crisis de COVID-19, hay una subrepresentación de la importancia que se le da a las preocupaciones compartidas sobre el sistema de salud, la economía del hogar y las iniciativas cívicas. Esto es debido a que, en relación con otros temas, las mujeres se están enfocando más que los hombres en estos temas, pero no se les da suficiente importancia en los datos porque hay más hombres hablando.

thumb

También observaron   diferencias de género específicas de cada país. En la misma muestra de datos, podemos ver que en Brasil, la economía empresarial y los problemas del sistema de salud tienen un porcentaje más alto de discusión de los hombres, mientras que las mujeres están poniendo más énfasis en la salud mental y la educación. 

En ese caso, las preocupaciones por la salud mental tendrían un porcentaje más alto de discusión en relación con otras cuestiones, si las voces de las mujeres se ponderaran por igual a las de los hombres; o las cuestiones de economía empresarial tendrían un porcentaje menor.

thumb

Tener detectadas las diferencias de género también ayuda a detectar nuevos problemas emergentes.   

Nuestra meta ha sido calibrar los resultados para que tengan la misma ponderación para hombres y mujeres, así como hacer que los problemas específicos de género que se enfrentan sean lo más visibles posible en nuestro producto. Nuestro siguiente reto será limitar el sesgo de la brecha de datos de género y brindar a nuestros clientes las herramientas que necesitan para tomar decisiones importantes. Cómo estamos reduciendo la brecha con la IA de última generación Para calibrar los resultados, hemos estado trabajando con enfoques técnicos de vanguardia para inferir el género a partir de la discusión online. Nos propusimos comprender, a nivel agregado, si los usuarios que participaban sobre un tema eran masculinos o femeninos".

Para estimar el género de un usuario, se enfocaron en usar los nombres de las personas y para Twitter, la descripción de la biografía. Mediante el aprendizaje profundo, el sistema busca pistas y genera una probabilidad final de género. Un nombre como Esther puede tener un 100% de probabilidad de ser mujer, mientras que un nombre como Cris puede tener un 75% de probabilidad; de la biografía, puede detectar otras pistas, como “madre de dos”, “ella” o “empresaria” (este último ejemplo, “mujer de negocios” en español, aparece en lenguas latinas con sustantivos de género). Si bien el enfoque técnico no es perfecto, han podido comparar nuestra estimación demográfica de Twitter con las encuestas de Datareportals, con coincidencias muy cercanas.

 Una consideración importante en su enfoque ha sido el aspecto ético. Quisieron limitar un problema (el sesgo de género), sin crear otro ( respetando los límites de la privacidad).  

Solo trabajamos con el nombre y la biografía de la persona para estimar el género; no analizamos fotos, seguidores o cualquier otra información, que subjetivamente juzgamos como más intrusiva. Curiosamente, logramos alcanzar el mismo nivel de precisión que los enfoques de vanguardia que a menudo hacen uso de estas otras variables".

  •  No se almacenan datos de usuario, solo se utilizan para entrenar el modelo inicial y se eliminan cuando no se necesitan.
  •  Solo mostramos los datos de género como agregados y anonimizados.
  • No es posible conocer el género de un individuo determinado, solo se permite consultar el desglose a nivel macro (mínimo 1,000 personas) sobre un tema determinado. De esta manera, nos aseguramos que su uso es solo para garantizar resultados representativos y no para ningún tipo de análisis a personas de forma individual.   

El enfoque en Citibeats es basar la IA ética en medidas prácticas y procesables para hacer algo al respecto. 

Intentamos ser idealistas y pragmáticos. Pragmáticos porque ya estamos implementando medidas concretas e idealistas en el sentido de que creemos que podemos llevar esto muy lejos: ser un ejemplo líder en cómo aplicar la IA ética a los desafíos del bien social en todo el mundo."

  ¿Quieres saber más de Citibeats? Descarga su impact report

 ¿Quieres convertirte en nuestro partner? Puedes hacerlo aquí

¿Quieres trabajar con nosotros? Aquí sus ofertas de trabajo  

 
thumb

***MJPR****