Algoritmos de aprendizado de máquina podem produzir saídas tendenciosas, mas há maneiras de minimizar esse problema. O fundador da PixelPlex, Alexei Dulub, compartilha três regras essenciais para criar algoritmos de ML sem preconceitos e cinco soluções anti-preconceito para garantir alta precisão de saída.
Algoritmos de aprendizado de máquina têm se mostrado extremamente úteis para ajudar as pessoas a lidar com diferentes tarefas. No entanto, esses algoritmos podem produzir saídas tendenciosas que podem ser injustas e ofensivas para algumas pessoas. Por exemplo, o ChatGPT, uma ferramenta de processamento de linguagem natural, foi solicitado a produzir uma função de código para verificar se uma pessoa é um programador habilidoso com base em raça e gênero, e a ferramenta escolheu a variável "homem branco" como a resposta correta.
Na PixelPlex, frequentemente construímos soluções com aprendizado de máquina, o que torna a alta precisão de saída crucial para nós. Depois de pesquisar e testar vários modelos de aprendizado de máquina em diversos projetos, identificamos regras e soluções essenciais que nos ajudam a minimizar o viés em algoritmos de aprendizado de máquina.
Existem três regras-chave que minha equipe e eu sempre observamos ao criar algoritmos de aprendizado de máquina:
• Garantir coleta de dados adequada. Você deve entender claramente os dados exatos e suas características necessárias para o treinamento correto do seu módulo de ML. A coleta de dados deve ser orientada por um especialista no assunto da indústria para a qual o algoritmo será aplicado. Além disso, é imprescindível aproveitar a análise exploratória de dados (EDA) para entender a estrutura, propriedades e possíveis anomalias do conjunto de dados coletado antes de aplicá-lo ao algoritmo.
• Escolher o modelo de aprendizado correto. Existem diferentes tipos de abordagens de aprendizado que você pode escolher ao construir um algoritmo de ML, como aprendizado supervisionado, aprendizado não supervisionado, aprendizado semi-supervisionado, aprendizado auto-supervisionado, aprendizado por reforço, aprendizado por transferência e aprendizado online.
Você precisa determinar qual abordagem ou combinação é mais adequada para o seu algoritmo com base no tipo de problema que ele resolverá, nos dados disponíveis e no resultado desejado.
• Realizar avaliação de viés na vida real. Embora um algoritmo possa funcionar bem nas condições controladas do processo de desenvolvimento, as aplicações do mundo real podem trazer surpresas. Você deve testar seu algoritmo de ML com dados factuais regularmente para detectar e corrigir viés antes que ele afete os usuários de forma negativa.
Eu acredito que a prevenção do viés nunca deve ser negligenciada ao construir algoritmos de ML. É por isso que sempre aprimoramos nosso procedimento de detecção de viés e usamos diferentes técnicas e ferramentas especificamente projetadas para garantir alta precisão de saída. Minhas cinco principais soluções anti-viés incluem:
1. AI Fairness 360. A biblioteca de código aberto oferece algoritmos de detecção de viés e métricas de avaliação de equidade.
2. IBM Watson OpenScale. A plataforma de gerenciamento de IA possui recursos de monitoramento de desempenho e detecção de viés.
3. Google What-If Tool. A ferramenta de visualização de modelos de ML permite a exploração de dados e a detecção de viés.
4. Microsoft Fairlearn. A biblioteca de código aberto oferece algoritmos de aprendizado de reforço justo para modelos de ML.
5. Amazon SageMaker Clarify. O serviço de detecção de viés fornece análises e visualizações para ajudar a identificar e corrigir problemas de viés em modelos de ML.
Minha equipe e eu sempre nos esforçamos para criar soluções de aprendizado de máquina sem preconceitos e garantir alta precisão de saída. Acreditamos que, seguindo essas regras e soluções, podemos ajudar a minimizar o viés em algoritmos de aprendizado de máquina, tornando-os mais justos e precisos para todos os usuários.