A inteligência artificial e o aprendizado de máquina estão cada vez mais presentes no mundo acadêmico, mas será que eles são realmente úteis? Neste post, exploramos as vantagens e desvantagens do uso do aprendizado de máquina na pesquisa e como ele pode ajudar os pesquisadores em diversos campos.
A inteligência artificial (IA) - ou aprendizado de máquina - parece estar em todos os lugares nos dias de hoje. Se você é um pesquisador, provavelmente já viu esses termos aparecerem cada vez mais na literatura acadêmica do seu campo. Mas quanto disso é realmente útil? Você também deveria estar aproveitando o aprendizado de máquina?
Neste artigo, descreverei alguns casos em que o aprendizado de máquina é útil para a pesquisa - e também quando não é - com base na minha própria experiência no campo da astronomia.
O aprendizado de máquina oferece o maior valor para problemas de pesquisa 'orientados por dados': quando você tem tantos dados que não consegue analisá-los manualmente. Nestes cenários, o aprendizado de máquina pode aliviar sua carga de trabalho e permitir que você se concentre em sua área de pesquisa. No entanto, adotar o aprendizado de máquina não está isento de armadilhas e custos ocultos.
A aplicação do aprendizado de máquina sem pensar pode resultar em algumas análises perigosas. Por exemplo, as redes neurais profundas são capazes de memorizar os dados que viram, causando comportamentos imprevisíveis ao lidar com novos dados. Da mesma forma, muitos algoritmos de aprendizado de máquina apresentam desempenho inferior ou falham completamente quando aplicados a novos domínios. O aprendizado de máquina também é suscetível a vieses e efeitos de seleção inerentes aos seus dados de treinamento. Por fim, o aprendizado de máquina pode não ser capaz de distinguir características importantes de variáveis confusas. Sua experiência em um campo especializado pode ajudá-lo a reconhecer e evitar essas armadilhas comuns.
Alguns algoritmos de aprendizado de máquina têm uma curva de aprendizado acentuada. Você já está conduzindo pesquisas em um campo, então pode parecer muito aprender uma disciplina inteiramente nova. Apenas aprender o jargão do aprendizado de máquina pode ser um grande obstáculo, mas felizmente existem muitos recursos para começar nesse campo (por exemplo, Fastai). Muitos conceitos em aprendizado de máquina têm analogias em outros campos - por exemplo, a otimização do modelo pode ser reformulada na linguagem da termodinâmica e da física estatística. Além disso, existem muitas subdisciplinas dentro do aprendizado de máquina, e você provavelmente não vai querer gastar todo o seu tempo explorando esses diferentes buracos de coelho.
Só porque algo pode ser feito com aprendizado de máquina, não significa que deva ser feito. Quando novos algoritmos sofisticados aparecem, é sempre empolgante vê-los aplicados aos seus problemas de pesquisa favoritos. Mas, em algum momento, precisamos passar da fase de prova de conceito para a fase de agregação de valor. Em outras palavras, você pode se perguntar: 'Se eu não usasse aprendizado de máquina, esse resultado ainda seria interessante?'
Quando aplicado com cuidado, através das lentes de um cético, o aprendizado de máquina pode viabilizar programas de pesquisa que, de outra forma, seriam inviáveis. De modo geral, o aprendizado de máquina pode capacitar pesquisadores de quatro maneiras.
1. Fazer previsões com base em tendências
Às vezes, você quer saber se seu conjunto de dados pode ser usado para determinar outra coisa. Por exemplo, você pode ter ouvido falar de como o aprendizado de máquina na medicina pode ajudar médicos na triagem de câncer. No meu campo da astronomia, é bastante simples tirar fotos de milhões de galáxias, mas tradicionalmente precisávamos fazer e analisar observações especializadas para entender os detalhes de como as galáxias evoluem. Ao usar o aprendizado de máquina, meus colaboradores e eu descobrimos que poderíamos estudar essas galáxias usando apenas imagens.
É fácil criar novos modelos de como as coisas devem se comportar, mas o verdadeiro teste de qualquer modelo é se ele tem algum poder preditivo. Ao identificar conexões dentro dos seus dados, você pode formular um modelo - e