Encontrar preconceito em modelos de aprendizado de máquina (ML) é difícil e, às vezes, as empresas descobrem sobre danos éticos não intencionais quando já alcançaram o público. Visando mudar isso, o Twitter está criando uma nova competição entre pesquisadores e hackers, com o objetivo de encontrar alguém capaz de corrigir o problema em relação ao preconceito racial e de gênero em seu algoritmo, o valor que será pago é de R$ 18 mil, de acordo com informações do Business Insider.
Em maio, compartilharam uma abordagem para identificar vieses nos seus algoritmos de saliência (também conhecido como algoritmo de recorte de imagem) e disponibilizaram um código para que outros reproduzam seu trabalho, para incentivar a comunidade a ajudar a identificar os danos potenciais desse algoritmo além do que eles mesmos identificaram.
Inspirados por como as comunidades de pesquisa e hackers ajudaram a área de segurança a estabelecer as melhores práticas para identificar e mitigar vulnerabilidades a fim de proteger o público. O twitter quer cultivar uma comunidade semelhante, focada na ética do ML, para ajudar a identificar uma gama mais ampla de questões do que fazer por conta própria. Com este desafio, eles pretendem abrir um precedente no Twitter e na indústria para a identificação proativa e coletiva de danos algorítmicos.
Para este desafio, estão compartilhando novamente o modelo de saliência e o código usado para gerar um recorte de uma imagem dado um ponto máximo de saliência previsto e pedindo aos participantes que construam sua própria avaliação. As inscrições bem-sucedidas considerarão métodos quantitativos e qualitativos em sua abordagem. Para obter mais detalhes sobre o desafio, acesse o site.