Possuo 1TB de armazenamento no OneDrive e finalmente o dia de ficar quase sem armazenamento chegou. Tenho nele o backup de muitas fotos. Sei que muitas são duplicadas, por isso pergunto:
Como posso remover esses arquivos/fotos duplicadas de maneira automática? Há uma ferramenta nativa, plugin ou aplicativo que faça isso?
Existem dois tipos de duplicações: a duplicação de um arquivo e a duplicação de uma imagem.
Na duplicação de um arquivo, o conteúdo binário duplicado é ipsis literis. Nesses casos, uma verificação por hash digesting (md5 por exemplo) é suficiente para revelar quais arquivos duplicam um conteúdo. É um processo que exige calcular o hash de todos os arquivos e agrupar os nomes de arquivos pelas suas hashes. Aquelas hashes que tiverem mais de um nome de arquivo, serão os conteúdos duplicados.
Já na duplicação de uma imagem, a detecção é mais complexa. Às vezes muda o formato, às vezes muda a resolução, às vezes muda a compressão, às vezes são fotos sequenciais de um mesmo evento, cujos ângulos serão ligeiramente diferentes. Os hashes serão totalmente diferentes. Nesses casos, uma ferramenta de visão computacional se fará necessária, computando modelos e referências fotográficas para cada imagem e então agrupando pela similaridade de itens da cena. Às vezes essa visão computacional envolve reconhecimento facial. Tem um programa que esqueci o nome, que não sei se tem pra Windows, mas que faz reconhecimento de similaridade de fotos e ainda consegue agrupar fotos por reconhecimento facial, tudo sendo computado diretamente em sua máquina, sem enviar nada pra nuvem.
É uma ótima dica. Mas teria que fazer por partes né, baixar algumas pastas, fazer a análise e depois fazer com outras. Meu telefone até tem armazenamento suficiente para todas as fotos, mas para todos os arquivos que tenho a nuvem acho que faltaria espaço.
Não não. A partir do momento que vc sincroniza o app de arquivos da Samsung com o OneDrive, ele já detecta os arquivos duplicados de lá. Aí vc vai em Analisar Armazenamento e tem a opção de arquivos duplicados.
Eu, particularmente, não sei se o próprio aplicativo do OneDrive tem essa função. Ou a versão web. Mas eu me surpreendi quando vi que o app de Arquivos tem.