Fala Rafael!
Já usamos essa opção, mas a tag canonical não é a melhor forma de lidar com essa situação, por alguns motivos:
- O Google vê a tag
canonical
como sugestão e não regra. Ele ainda indexa todos os posts e depois decide qual vai aparecer no ranking. Aqui vejo todas as urls no meu GSC. Repare na queda depois que coloquei a meta robots.
- A tag
canonical
é pra ser usada em casos onde o conteúdo das páginas for idêntico, o que não é o caso aqui. O conteúdo do post é exibido apenas no blog e lá destacamos apenas os comentários mais populares. Então na prática, as duas páginas são bem diferentes. - Por serem apenas variações da página principal, o Google pode considerar essas páginas como
Thin Content
. O próprio John Mueller já disse várias vezes que o ideal é que páginas assim não sejam nem indexadas, pois afetam a métrica de “qualidade geral” do domínio. - Mesmo que o Google opte por considerar a canonical (o que não acontece 100% das vezes), ele está gastando
crawl budget
para indexar um conteúdo que não serve nenhum propósito nas buscas. Quando um usuário busca algo, vai preferir cair no post principal, ou na url dos comentários?
Uma solução bem simples seria dar a opção de marcar categorias como não-indexáveis. Bastaria um checkbox na config da categoria, que quando marcada inseriria a tag meta robots no header dos tópicos.
Foi isso o que fiz aqui, mas na base da gambiarra hahaha Utilizei o sub_filter
do nginx pra substituir a canonical que começa com https://tecnoblog.net
pela meta robots.
Outro lugar que gera muitas urls de baixo valor é a paginação dentro dos tópicos. O Discourse cria uma URL pra cada post dentro do tópico. Isso fragmenta a página em vários links menores, cada um com um post pequeno.
A canonical então aponta sempre para o post principal, ou pra ?page
onde o o post está. Nenhum dos links de posts possui o mesmo conteúdo do link principal do tópico, ou da ?page
.
Aliás, o próprio Google diz que não se deve criar paginações apontando a canonical pra outra página.
Do ponto de vista de SEO, a solução mais acertada seria utilizar o #ID no final da URL do tópico, em vez de alterar a URL conforme o usuário rola a página.
Poderia até trocar a URL, mas uma por página e não por post. A canonical então deveria apontar para a url amigável da paginação, complementando com o #ID do post no final da URL, pra direcionar o usuário.
Dessa forma:
- O conteúdo inteiro do tópico estaria visível (e indexável) em apenas URL. Isso fortalece a página principal;
- Reduziria drasticamente a quantidade de thin content;
- Reduziria drasticamente o uso do crawl budget;
- Facilitaria a compreensão da página para o robô, já que o #ID teria um efeito parecido com o uso de Índice.
Sobre o item 4, também seria legal suportar dados estruturados. Algumas comunidades utilizam o de Q&A
, que permite que o Google entenda a formatação do conteúdo e exiba resultados destacados na busca.
Se eu puder ajudar em mais alguma questão de SEO, é só chamar!
Ps: legal ver você aqui! Já interagimos em alguns tópicos lá na meta do discourse.