Aguardemos para saber se é mais um Chromium.
Chromium é só uma base para criação de navegadores web usando o motor Blink… Nesse caso a idéia é um navegador que use AI pra “navegar” na internet pro você, ou seja, mesmo que use o motor do Chromium pra renderizar as páginas, a maneira de interagir é bem diferente.
Recomendo usar o Arc, é um navegador bem interessante que usa AI pra navegar na internet por você. Não tem nada a ver com navegadores tipo o Chrome, porque você não vê a página em si, o navegador acessa várias páginas e gera um sumário pra você
– Pay no attention to the man behind the curtains… (“Ignore o homem atrás das cortinas”)
O homem atrás das cortinas: um Puppeteer/Selenium closed-source recebendo comandos de um auto-completador (LLM) fixo.
A única novidade, tanto para o “Operator” da OpenAI quanto pro “Comet” da Perplexity, está na integração “nativa” (entranhada nos códigos internos modificados do Chromium, ou talvez seja da forma mais cômoda e esperada possível: via extensão/plugin) entre a saída de uma LLM específica (cuja instrução em comum deve ser algo como “Suas respostas serão limitadas a comandos dentro do protocolo Chromium DevTools”) e a entrada do protocolo DevTools, a saída gráfica da aba para a entrada img2txt (visão computacional) do modelo de linguagem.
Será que manipulam o valor do navigator.webdriver
e/ou navigator.userAgent
? Porque tem sites (como a Shopee, experiência própria) que detectam essas propriedades (principalmente o webdriver
) a fim de proibir/coibir atividade autômata. Se o navegador parecer como qualquer navegador diretamente interfaçado (existe esse termo?) para a entrada humana, sem quaisquer indicações de seu automatismo, prevejo sites começando a usar (com mais frequência do que já o fazem) métricas de mouse e teclado… estatísticas em tempo-real dos eventos JS mousemove
, touchstart
/touchend
, e keypress
, determinando velocidade, aceleração e etc.
No caso do Operator, ainda tem ocorrido um bloqueio por conta do bloco de endereçamento IP da OpenAI, já que o navegador automatizado está rodando nos servidores deles. Não seria o caso pro Comet, cujas requisições partiriam do IP do usuário.
Muitos captchas (como ReCaptcha da Google além do captcha da CloudFlare) usam movimento de mouse/velocidade de toque… E talvez não vai ser suficiente, se a OpenAi e/ou Perplexity começarem a adicionar aleatoriedade e movimentos erráticos, emulando os movimentos humanos…
No fim, preparem-se que a Web vai ficar ainda mais rígida e chata com os Captchas.
Provavelmente, já que quase ninguém usa o “Gecko” (msm também sendo de código aberto)!!
Pois é, gostaria de ver alguém trazer um novo, algo inovador. Como nos comentários do outro post, estão fazendo muito do mesmo que no final uma só empresa decide o rumo de tudo.
Sei que há diferenças (no caso a forma de a IA trabalhar), mas é como trocar o ALA por um OMO ou Brilhante ou Surf, tudo é Unilever. Mais ou menos isso
Sim, eu tô com você!!! Até pq, se não fossem empresas que realmente fazem algo diferente, não teríamos hj a Qualcomm correndo atrás em fzr os PCs Windows ARM darem certo (pois foi graças a iniciativa da Apple com seus Apple Silicon e o M1), e estaria todo mundo ainda entre Intel e AMD, sem grandes mudanças de padrão, apenas de specs (apenas um exemplo na área tech, mas tem mtos outros)!!!
Lembrei daquela notícia, dos bolsonaristas (nada contra eles, deixar claro, pra evitar hate kkk) querendo fzr um boicote a Piracanjuba, por causa de uma fala da Ivete Sangalo contrária, e no lugar comprando Ninho, achando que ainda era da Nestlé, mas na vdd, quem tem a licença pra fabricar o Ninho hj em dia, é, advinha…A PIRACANJUBA (Laticínios Bela Vista)