Los algoritmos de aprendizaje automático pueden producir resultados sesgados. Descubre cómo minimizar el sesgo en los algoritmos de aprendizaje automático con estas tres reglas clave.
En los últimos años, los algoritmos de aprendizaje automático (ML) se han mostrado muy útiles para ayudar a las personas a lidiar con diferentes tareas: clasificación y agrupación de datos, revelación de patrones, detección de anomalías y muchas más. Sin embargo, los algoritmos de ML a veces pueden producir resultados sesgados que pueden ser muy injustos y ofensivos para algunas personas. Por ejemplo, incluso hay audiencias judiciales en Nueva York que buscan aclarar la legislación sobre herramientas de contratación automatizadas y sus posibles conclusiones sesgadas.
En mi empresa, regularmente construimos soluciones impulsadas por ML, por lo que la alta precisión de salida es crucial para nosotros. Después de investigar y probar múltiples modelos de ML en varios proyectos, logramos identificar reglas y soluciones esenciales que nos ayudan a minimizar el sesgo en los algoritmos de ML.
Hay tres reglas clave que mi equipo y yo siempre observamos al crear algoritmos de ML:
• Asegurar la recopilación adecuada de datos. Debe comprender claramente los datos exactos y sus características que se requieren para el entrenamiento correcto de su módulo de ML. La recopilación de datos debe ser guiada por un experto en la materia en la industria a la que se aplicará el algoritmo. Además, es imprescindible aprovechar el análisis exploratorio de datos (EDA) para comprender la estructura, propiedades y posibles anomalías del conjunto de datos recopilado antes de aplicarlo al algoritmo.
• Elegir el modelo de aprendizaje correcto. Existen diferentes tipos de enfoques de aprendizaje que puede elegir al construir un algoritmo de ML, como el aprendizaje supervisado, el aprendizaje no supervisado, el aprendizaje semi-supervisado, el aprendizaje auto-supervisado, el aprendizaje por refuerzo, el aprendizaje de transferencia y el aprendizaje en línea. Debe determinar qué enfoque o combinación es el más adecuado para su algoritmo en función del tipo de problema que resolverá, los datos disponibles y el resultado deseado.
• Realizar una evaluación de sesgo en la vida real. Aunque un algoritmo puede funcionar bien en las condiciones controladas del proceso de desarrollo, las aplicaciones del mundo real pueden sorprenderlo. Debe probar su algoritmo de ML con datos factuales de forma regular para detectar y corregir el sesgo antes de que afecte negativamente a los usuarios.
Creo que la prevención del sesgo nunca debe ser descuidada al construir algoritmos de ML. Es por eso que siempre mejoramos nuestro procedimiento de detección de sesgo y utilizamos diferentes técnicas y herramientas específicamente diseñadas para garantizar una alta precisión de salida.
Mis cinco principales soluciones anti-sesgo incluyen:
1. AI Fairness 360. La herramienta de código abierto wa