banner2
El conjunto de datos sintéticos de las víctimas de la trata de personas podría permitir el trabajo de big data sin compromisos de privacidad - Start Up Gazzete
Please, assign a menu
Get In Touch
541 Melville Ave, Palo Alto, CA 94301,
ask@ohio.clbthemes.com
Ph: +1.831.705.5448
Work Inquiries
work@ohio.clbthemes.com
Ph: +1.831.306.6725

El conjunto de datos sintéticos de las víctimas de la trata de personas podría permitir el trabajo de big data sin compromisos de privacidad

Banner1

Para combatir la trata de personas de manera efectiva, quienes la combaten deben entenderla, y en estos días, eso significa datos. Desafortunadamente, por razones obvias no hay un índice conveniente de víctimas de trata, aunque esta información confidencial es de alguna manera abundante. Microsoft y la Organización Internacional para las Migraciones pueden haber encontrado un camino a seguir con una nueva base de datos sintética que tiene todas las características importantes de los datos reales de tráfico, pero es completamente artificial.

Si bien cada víctima es incuestionablemente individual, las preguntas básicas de alto nivel, como qué países son cada vez más la fuente o el medio de la trata, qué rutas y métodos se utilizan y dónde terminan las víctimas, son una cuestión de estadísticas. La evidencia para identificar tendencias y patrones, crucial para la prevención, está encerrada en miles de estas historias individuales que la mayoría preferiría no publicitar.

«Los datos administrativos sobre casos identificados de trata de personas representan una de las principales fuentes de datos disponibles, pero dicha información es altamente sensible», dijo el coordinador del programa de la OIM, Harry Cook, en un comunicado de prensa que describe el conjunto de datos. «La OIM ha estado encantada de trabajar con Microsoft Research en los últimos dos años para avanzar en el desafío crítico de compartir dichos datos para su análisis, protegiendo al mismo tiempo la seguridad y la privacidad de las víctimas».

banner4

Históricamente, para cosas como bases de datos de delitos e información médica, la estrategia es redactar liberalmente, pero este método de «desanonimización» ha demostrado ser ineficaz contra cualquier intento serio de reconstruir los datos. Con numerosas bases de datos públicas y filtradas y potencia de cálculo en el grifo, la información redactada se puede suministrar de manera bastante confiable.

La opción adoptada por Microsoft Research es usar los datos originales como base para un conjunto de datos sintéticos que conserva todas las relaciones estadísticas importantes de la fuente, pero ninguna de la información identificable. Y no se trata solo de convertir a «Jane Doe» en «Janet Doeman» y su ciudad natal de Cleveland a Queens. En su lugar, los grupos de no menos de 10 personas con datos similares o superpuestos se fusionan para crear un conjunto de atributos que los representan con precisión estadísticamente, pero no se pueden usar para identificarlos individualmente.

Naturalmente, esto no tiene la granularidad de los datos originales, pero a diferencia de la fuente sensible, estos datos realmente se pueden usar. No es necesariamente para que algún grupo de trabajo analice y diga «está bien, la próxima operación de contrabando se basará en …» sino que estos datos, basados en evidencia de primera mano, pueden señalarse como un registro fáctico para abordar esto a nivel de política y diplomacia. Donde antes uno puede haber tenido que decir de una manera más general que el País X o el Gobierno Z fueron negligentes o cómplices en estos asuntos, tener datos duros para respaldar eso le permite decir que «el 36 por ciento de las víctimas de tráfico sexual pasan por su jurisdicción».

Author avatar
Joshua Smith
https://startupgazzete.com

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies