Reddit processa empresa de IA por supostamente 'raspar' comentários de usuários para treinar chatbot

A plataforma de mídia social Reddit processou a empresa de inteligência artificial Anthropic, alegando que ela está “raspando” ilegalmente os comentários dos usuários do Reddit para treinar seu chatbot Claude
A plataforma de mídia social Reddit processou a empresa de inteligência artificial Anthropic, alegando que ela está "copiando" ilegalmente os comentários dos usuários do Reddit para treinar seu chatbot Claude.
O Reddit alega que a Anthropic usou bots automatizados para acessar o conteúdo do Reddit, apesar de ter sido solicitada a não fazê-lo, e "treinou intencionalmente os dados pessoais dos usuários do Reddit sem nunca solicitar seu consentimento".
A Anthropic não retornou imediatamente um pedido de comentário na quarta-feira. O Reddit entrou com a ação judicial na quarta-feira no Tribunal Superior da Califórnia, em São Francisco, onde ambas as empresas estão sediadas.
“As empresas de IA não deveriam ter permissão para extrair informações e conteúdo de pessoas sem limitações claras sobre como podem usar esses dados”, disse Ben Lee, diretor jurídico do Reddit, em um comunicado na quarta-feira.
O Reddit já firmou acordos de licenciamento com o Google, OpenAI e outras empresas para permitir que elas treinem seus sistemas de IA nos comentários do Reddit.
Esses acordos “nos permitem aplicar proteções significativas para nossos usuários, incluindo o direito de excluir seu conteúdo, proteções de privacidade do usuário e impedir que os usuários recebam spam usando esse conteúdo”, disse Lee.
A Anthropic foi fundada por ex-executivos da OpenAI em 2021 e seu principal chatbot, o Claude, continua sendo um concorrente importante do ChatGPT da OpenAI. Assim como outras empresas de IA, a empresa depende fortemente de sites como a Wikipédia e o Reddit, repletos de fontes ricas de materiais escritos para ensinar a um assistente de IA os padrões da linguagem humana.
Em um artigo de 2021 coautorado pelo CEO da Anthropic, Dario Amodei — citado no processo — pesquisadores da empresa identificaram os subreddits, ou fóruns temáticos, que continham dados da mais alta qualidade, como aqueles focados em jardinagem, história ou pensamentos que as pessoas têm no chuveiro.
Em 2023, a Anthropic argumentou em uma carta ao Escritório de Direitos Autorais dos EUA que "a maneira como Claude foi treinado se qualifica como um uso essencialmente legal de materiais", ao fazer cópias de informações para realizar uma análise estatística de um grande conjunto de dados.
Mas o processo do Reddit é diferente de outros movidos contra empresas de IA porque não alega violação de direitos autorais. Em vez disso, foca na suposta violação dos termos de uso do Reddit e na concorrência desleal que, segundo ele, foi criada.
ABC News