Os algoritmos de aprendizado de máquina podem produzir resultados preconceituosos, mas há maneiras de minimizar o viés. O CEO da PixelPlex, Alexei Dulub, compartilha três regras essenciais para evitar o preconceito em algoritmos de aprendizado de máquina.
Os algoritmos de aprendizado de máquina têm se mostrado extremamente úteis para lidar com diferentes tarefas, como classificação e agrupamento de dados, detecção de padrões e anomalias, entre outras. No entanto, há casos em que os algoritmos de aprendizado de máquina produzem resultados preconceituosos que podem ser muito injustos e ofensivos para algumas pessoas.
Um exemplo disso é o ChatGPT, uma ferramenta de processamento de linguagem natural que está em alta atualmente e que é capaz de responder perguntas dos usuários, auxiliar na composição de e-mails e artigos e até mesmo escrever código. Um professor da Universidade da Califórnia, Berkeley, pediu ao ChatGPT para produzir uma função de código para verificar se uma pessoa é um programador habilidoso com base na raça e no gênero, e a ferramenta escolheu a variável "homem branco" como a resposta correta.
Na minha empresa, regularmente construímos soluções de aprendizado de máquina, que é por que a alta precisão de saída é crucial para nós. Depois de pesquisar e testar vários modelos de aprendizado de máquina em vários projetos, conseguimos identificar regras e soluções essenciais que nos ajudam a minimizar o preconceito em algoritmos de aprendizado de máquina.
Existem três regras principais que minha equipe e eu sempre seguimos ao criar algoritmos de aprendizado de máquina:
• Garantir a coleta de dados adequada. É importante entender claramente os dados exatos e suas características necessárias para o treinamento correto do seu módulo de aprendizado de máquina. A coleta de dados deve ser guiada por um especialista no assunto na indústria em que o algoritmo será aplicado. Além disso, é essencial aproveitar a análise exploratória de dados (EDA) para entender a estrutura, as propriedades e possíveis anomalias do conjunto de dados coletados antes de aplicá-lo ao algoritmo.
• Escolha o modelo de aprendizado correto. Existem diferentes tipos de abordagens de aprendizado que você pode escolher ao construir um algoritmo de aprendizado de máquina, como aprendizado supervisionado, aprendizado não supervisionado, aprendizado semi-supervisionado, aprendizado auto-supervisionado, aprendizado por reforço, transferência de aprendizado e aprendizado online.
Você precisa determinar qual abordagem ou combinação é a mais adequada para o seu algoritmo com base no tipo de problema que ele resolverá, nos dados disponíveis e no resultado desejado.
• Realize avaliação de preconceito na vida real. Embora um algoritmo possa funcionar bem nas condições controladas do processo de desenvolvimento, as aplicações do mundo real podem apresentar surpresas. Você deve testar seu algoritmo de aprendizado de máquina com dados factuais regularmente para detectar e corrigir o preconceito antes que ele afete negativamente os usuários.
Eu acredito que a prevenção de preconceitos nunca deve ser negligenciada ao construir algoritmos de aprendizado de máquina. É por isso que sempre aprimoramos nosso procedimento de detecção de preconceito, bem como usamos diferentes técnicas e ferramentas especificamente projetadas para garantir alta precisão de saída. Minhas cinco principais soluções anti-preconceito incluem:
1. AI Fairness 360. A ferramenta de código aberto wa