ChatGPT revela CPFs de figuras públicas no Brasil

Os dados pessoais de figuras públicas devem ser públicos de acordo com a Lei de Acesso à Informação.
Insisti ao ChatGPT saber o CPF de Jair Bolsonaro e o site não me deu a resposta.

1 Like

Quem não me garante que o ChatGPT não se alimentou também com dados vazados daqueles mega leaks anteriores?

Qualquer individuo politicamente exposto ou funcionários públicos já tem seus dados publicados em qualquer Diário Oficial. Que entra na Lei de Acesso a Informação.

2 Likes

O maior problema é que isso (disponibilidade de dados pessoais em resultados da Web) não se limita a figuras públicas, não.

Quem é ou já foi MEI (muita gente desde a criação dessa modalidade até hoje) tem/teve seu nome completo atrelado ao CPF (que é literalmente a razão social de qualquer MEI) entregues de bandeja pela Receita Federal para agregadores como “cnpj biz”, “cnpj info”, entre outros. E não só CPF a partir do nome completo: endereço, telefone, e-mail, tudo!

E pra solicitar remoção não é nada trivial: a pessoa tem que mandar o Comprovante de MEI pro agregador, o que significa que vão ter em mãos um documento que só o MEI conseguiria emitir, abrindo assim possibilidade daquele agregador vazar o Comprovante pra terceiros ou eles próprios usarem de forma maliciosa: contratar serviços em nome da empresa, abrir contas bancárias em nome da empresa, etc. Se o MEI é cabreiro o suficiente pra não confiar no agregador, não há outra alternativa a não ser deixar quieto e “permitir” que o agregador continue indexando os dados do mesmo.

Com nome e CPF acompanhados de endereço, telefone e e-mail, disponíveis escancaradamente na Internet, em domínios internacionais, não me surpreenderia que tais dados também façam parte do treinamento de LLMs.

Quem já prestou concurso também tem seus dados lá disponíveis nos resultados de busca. Geralmente é o RG acompanhado do nome completo, mas em alguns casos é o CPF (que, olha só, há alguns anos passou a ser o documento usado no lugar do RG no tal de “CIN” porque “mais de um RG pode ser emitido através de estados diferentes, então vamos centralizar tudo no número de CPF”… uau, boa ideia! Os golpistas, anunciantes e agregadores de internet estão amando a ideia). Embora são sites .br, não duvido que existam agregadores internacionais também.

Quem já abriu processo judicial, também vai ter seu nome completo indexado por agregadores, também. Geralmente escondem o número do processo por trás de uma paywall, mas o nome inteiro aparece ali, junto, em algumas situações, do CPF ou RG, email, telefone, etc.

E mesmo que uma pessoa nunca abriu MEI nem processo nem prestou concurso, ainda passa por várias outras situações que levam à publicação de informações pessoais na Internet. Isso sem contar os vazamentos de dados porque os gênios dos serviços de internet decidiram que é uma ótima ideia atrelar e-mail e telefone celular das pessoas em um banco de dados dando sopa para um hacker qualquer ou mesmo um funcionário da empresa resolver vazar isso, que vai acabar parando em resultados públicos.

Resumo da ópera: vivemos tempos sombrios para a privacidade. Daí há aquela falácia do “quem não deve não teme”: segundo essa ideia, não deveríamos temer golpistas usando nossos dados, não deveríamos temer empresas puxando nossos dados… É por culpa desses indivíduos do “quem não deve não teme” que nossos dados estão aí, soltos na Internet, pra qualquer golpista escolher qual vai usar pro próximo golpe.

1 Like

" Não é preciso muito esforço para lembrar que há algum tempo a própria OpenAI estava sendo processada por violar dados de privacidade ao absorver toda a web escrita sem nenhum tipo de consentimento. No final das contas, foi assim que a empresa deu passos largos com o GPT."
E o DeepSeek é o vilão neh kkkkkkkk…

1 Like