Nos dias de hoje da IA generativa, as empresas que extraem dados para treinar seus modelos de aprendizado de máquina e reproduzem conteúdo protegido por direitos autorais de artistas e editores têm causado muitas preocupações. Agora, em um esforço para resolver esse problema, o Google proposto uma nova opção de “opt-out”, que permitiria aos editores impedir que seus trabalhos fossem usados para treinar IA.
Essa solução vem após a postura dura do governo australiano em relação a aplicativos de IA de “alto risco”, que envolveu a imposição de restrições à geração de deep fakes, disseminação de desinformação e perpetuação da discriminação. Embora o Google tenha mantido sua posição sobre o uso justo de dados para treinar modelos de IA, essa nova solução pode atenuar a disputa em andamento entre editores e empresas de IA sobre a utilização de material protegido por direitos autorais.
“A regra geral é que você precisa de milhões de pontos de dados para ser capaz de produzir resultados úteis… professor sênior da UNSW Law and Justice.
solução do Google
Embora os detalhes específicos sobre a implementação permaneçam incertos, a proposta do Google para o sistema de exclusão espelha de perto o protocolo robots.txt comumente empregado por sites para impedir que os mecanismos de pesquisa indexem segmentos específicos de seu conteúdo.
“Acreditamos que todos se beneficiam de um ecossistema de conteúdo vibrante. A chave para isso é que os editores da web tenham escolha e controle sobre seu conteúdo e oportunidades de obter valor da participação no ecossistema da web”, lê Postagem no blog do Google.
No entanto, a abordagem do Google em relação à eliminação de dados também levantou algumas sobrancelhas na indústria. Isso ocorre porque a empresa atualizou recentemente sua política de privacidade, o que permitiu aproveitar o conteúdo gerado pelo usuário para o desenvolvimento de IA. No entanto, a introdução do mecanismo de opt-out representa uma mudança de paradigma na dinâmica dos direitos autorais, pois as empresas de IA, incluindo o Google, não seriam capazes de extrair dados de editores ou músicos sem obter o consentimento explícito do legítimo proprietário.