Mustafa Suleiman, executivo-chefe de inteligência artificial da Microsoft, disse esta semana que as empresas de aprendizado de máquina podem extrair a maior parte do conteúdo postado online e usá-lo para treinar redes neurais porque é essencialmente “software livre”.
Logo depois, o Centro de Reportagens Investigativas foi criado. Entre com uma ação judicial contra a OpenAI Seu maior investidor, a Microsoft, “por usar o conteúdo de uma organização de notícias sem fins lucrativos sem permissão ou compensação”.
Isso segue os passos de oito jornais Ajuizou uma ação judicial contra OpenAI e Microsoft Em abril, o The New York Times acusou o Facebook de supostamente apropriar-se indevidamente de conteúdo, algo que o mesmo jornal havia feito quatro meses antes.
Depois, há os dois autores brilhantes Ajuizou uma ação judicial contra OpenAI e Microsoft Em janeiro, eles alegaram ter treinado modelos de IA em obras de autores sem permissão. Além disso, em 2022, vários desenvolvedores anônimos entraram com uma ação judicial contra OpenAI e GitHub com base em alegações de que as organizações usaram código publicado publicamente para treinar modelos generativos, violando os termos de sua licença de software.
Ele foi questionado em Entrevista Numa entrevista com Andrew Ross Sorkin, da CNBC, no Aspen Ideas Festival, sobre se as empresas de IA roubaram efectivamente a propriedade intelectual do mundo, Solomon reconheceu a controvérsia e tentou distinguir entre o conteúdo que as pessoas publicam online e o conteúdo apoiado por detentores de direitos de autor corporativos.
“Acho que em termos de conteúdo que já existe na web aberta, o contrato social para esse conteúdo desde a década de 1990 tem sido o uso justo”, disse ele. “Qualquer um poderia copiá-lo, recriá-lo, reproduzi-lo com ele. Era software livre, se você quisesse. Esse era o entendimento.”
Suleiman destacou que existe outra categoria de conteúdo, que são materiais publicados por empresas que possuem advogados.
“Há uma categoria separada onde um site, editor ou organização de notícias disse explicitamente: ‘Não me exclua ou rastreie por qualquer motivo que não seja para me indexar, para que outros possam encontrar este conteúdo’”, explicou ele. “Mas essa é uma área cinzenta. Acho que isso chegará aos tribunais.”
Isto é para dizer o mínimo. Embora pareça certo que as declarações de Soliman ofenderão os criadores de conteúdo, ele não está totalmente errado – não está claro onde estão as linhas legais em relação ao treinamento e à produção do modelo de IA.
A maioria das pessoas que publicam conteúdo online como indivíduos violaram os seus direitos de alguma forma ao aceitarem os termos de contratos de serviço oferecidos pelas principais plataformas de redes sociais. A decisão do Reddit de licenciar as postagens de seus usuários para a OpenAI não aconteceria se o gigante da mídia social acreditasse que seus usuários tinham direito legítimo aos memes e dados que ele espalha.
O facto de a OpenAI e outras empresas que criam modelos de IA estarem a fazer acordos de conteúdo com grandes editoras mostra que uma marca forte, dinheiro suficiente e uma equipa jurídica podem trazer grandes operações tecnológicas para a mesa.
Por outras palavras, aqueles que criam conteúdos e os publicam online estão a criar software livre, a menos que retenham, ou possam atrair, advogados dispostos a desafiar a Microsoft e os seus semelhantes.
em papel Num estudo publicado pela SSRN no mês passado, Frank Pasquale, professor de direito na Cornell Tech e Cornell Law School nos EUA, e Haochen Sun, professor associado de direito na Universidade de Hong Kong, exploram a incerteza jurídica em torno do uso de dados protegidos por direitos autorais para treinar inteligência artificial e se os tribunais considerariam tal uso justo. Concluem que a IA deve ser abordada a nível político, porque as leis actuais são inadequadas para responder às questões que agora precisam de ser abordadas.
“Como há tanta incerteza sobre a legalidade do uso de obras protegidas por direitos autorais pelos provedores de serviços de IA, os legisladores precisarão articular uma nova visão ousada para reequilibrar direitos e responsabilidades, assim como fizeram na esteira do desenvolvimento da Internet (liderando à Lei de Direitos Autorais do Milênio e à Publicação de Materiais Digitais de 1998), argumentam.
Os autores apontam que a contínua colheita não remunerada de obras criativas ameaça não apenas escritores, compositores, jornalistas, atores e outros profissionais criativos, mas a própria inteligência artificial, que acabará sendo privada de dados de treinamento. Os autores prevêem que as pessoas deixarão de disponibilizar o seu trabalho online se este for utilizado apenas para alimentar modelos de IA que reduzam a zero o custo marginal da criação de conteúdos e neguem aos criadores a possibilidade de qualquer recompensa.
Este é o futuro que Salomão prevê. “A economia da informação está prestes a mudar radicalmente porque somos capazes de reduzir os custos de produção de conhecimento a zero em termos de custo marginal”, afirma.
Todo o software gratuito que você ajudou a criar pode ser seu por uma pequena taxa de assinatura mensal. ®