PORTFÓLIO
Meta vai usar dados de Facebook e Instagram para treinar IA
Por Ricardo Syozi | Editado por Douglas Ciriaco
(Foto: Upklyak/Freepik)
Uma afirmação do CEO da Meta Mark Zuckerberg chamou a atenção de especialistas em privacidade digital e de pessoas que usam as plataformas da empresa. Segundo o empresário, a Meta tem mais dados de usuários do que foi utilizado no treinamento do ChatGPT, algo que a companhia pode usar para treinar seus próprios sistemas de inteligência artificial.
A empresa planeja usar postagens e comentários do Facebook e Instagram no treinamento dos robôs, porém isso levanta algumas preocupações, pois envolve questões de privacidade e de comportamento. Por isso, o Canaltech falou com alguns especialistas no assunto para tentar entender a situação.
Zuckerberg quer treinar IA com posts de redes sociais
No relatório financeiro divulgado no início de fevereiro, a Meta afirmou que o número de pessoas que usam ativamente o Facebook cresceu 6% em relação ao mesmo período do ano passado. Esse aumento seria positivo para várias marcas, mas Mark Zuckerberg não está satisfeito.
“A próxima parte importante do nosso manual é aprender com dados exclusivos e ciclos de feedback em nossos produtos”, comentou o executivo. “No Facebook e no Instagram, existem centenas de bilhões de imagens compartilhadas publicamente e dezenas de bilhões de vídeos públicos, que estimamos ser maiores do que o conjunto de dados ‘Common Crawl’, e as pessoas também compartilham inúmeras postagens de texto públicos em comentários em nossos serviços”, completou.
O destaque para o relato acima é a expressão “Common Crawl”, que se refere a um arquivo de 250 bilhões de páginas da web que pode ser usado para treinar uma IA generativa como o ChatGPT da OpenAI ou o Gemini do Google.
No entanto, ao usar os dados de comentários e posts de suas redes sociais, a Meta poderia cruzar a linha da privacidade digital. Além disso, é preciso lembrar que tanto o Facebook quanto o Instagram ainda são ambientes de opiniões de pessoas consideradas tóxicas, o que aumenta a preocupação sobre um robô treinado a partir disso.
Seus dados = produto
A ideia de utilizar postagens e comentários do Facebook e Instagram para treinar uma inteligência artificial sugere que Mark Zuckerberg esteja tratando as pessoas que usam as redes sociais como um tipo de produto. Na visão do advogado especialista em direito digital Marcelo Cárgano, do escritório Abe Advogados, é mais ou menos isso o que ocorre.
“Tudo o que você curte, o que você dá like, o que você não dá like, o que você comenta, o que você vê, o que seus amigos postam, quem são seus amigos, quais são seus interesses, tudo isso é usado, é processado e é transformado num produto”, afirma o especialista.
Por outro lado, Cárgano aponta que ainda há muitas dúvidas no uso de dados pessoais em redes sociais, momento esse que o CEO da Meta pode estar aproveitando. Como tudo em geral não está claro para as pessoas, não fica evidente se uma empresa tem ou não o direito de usar essas informações.
“Desde as aprovações das leis de dados pessoais, certamente isso [permissão para uso pleno dos dados das pessoas nas redes] não é verdade e, apesar disso, o Mark Zuckerberg já tomou a decisão de começar a tratar os dados pessoais para treinar sua inteligência artificial”, destaca.
Além disso, o especialista diz que postagens, likes e comentários também são dados pessoais — ou seja, precisaria haver o consentimento das pessoas para serem usados no treinamento de robôs.
A Meta deveria se preocupar com ética e comunidade
Outro fator de risco que vale a atenção é se a Big Tech ultrapassar os termos que a companhia coloca para as pessoas quando elas fazem o cadastro tanto no Facebook quanto no Instagram.
Sócio da área de TMT, Privacidade & Proteção de Dados do Maneira Advogados, Matheus Puppe defende que é fundamental os usuários estarem cientes e concordarem com o uso de seus dados para treinamento de IA.
“A coleta e o uso de dados devem ser limitados a propósitos específicos, legítimos e explícitos. O uso de dados publicamente compartilhados para treinar IA pode se desviar das expectativas originais dos usuários ao serem usados dessa maneira”, explica o profissional.
No entanto, há algo a mais nesse assunto, que se relaciona diretamente com a parte ética da Internet: questões éticas e sociais que podem causar algoritmos problemáticos.
“É importante considerar o impacto social e ético do treinamento de IA com dados públicos”, comenta Puppe. “Isso inclui preocupações sobre viés algorítmico, discriminação e a potencial erosão da privacidade coletiva.”
Ainda para o especialista, é preciso “questionar se a utilidade pública e potencial revolucionário da IA justifica estas ‘modulações’ nos direitos de privacidade em ambiente digital.”
Sob o olhar do direito digital, um ponto a ser considerado é o consentimento informado — processo para obter permissão para divulgar informações de um indivíduo, que é fundamental para deixar claro para as pessoas como será feito o uso de seus dados. Isso requer muita transparência da empresa, mas nem sempre é a realidade.
Meta não é novata nos tribunais
Questões de privacidade digital já trouxeram dor de cabeça para a Meta no passado. A empresa foi acusada de muitas coisas nesse quesito, como violar direito autoral para treinar IA e de usar livros sem autorização para o treinamento de robôs.
Se Zuckerberg continuar com sua ideia de usar postagens do Facebook e do Instagram para alimentar sua inteligência artificial, é possível que novos processos estejam a caminho.