conteúdo duplicado

Conteúdo duplicado: como evitar e o que fazer quando acontece?

O conteúdo duplicado é um dos problemas que mais afetam as estratégias de SEO.

O conteúdo duplicado é um dos problemas que mais afetam as estratégias de SEO.

Para você entender melhor, basta se colocar no lugar de um consumidor que faz uma pesquisa no Google.

Vamos supor que dos 5 sites que ele resolve acessar para encontrar o que estava buscando, 2 apresentam conteúdos repetidos.

Imagine como isso seria ruim para a experiência de navegação dele e para a reputação dos sites com o material duplicado.

Muitas vezes, problemas como esse ocorrem de forma involuntária, especialmente por desconhecimento técnico dos administradores do site ou falta de contato entre as páginas que distribuem um mesmo conteúdo.

No entanto, tem muita gente que duplica o conteúdo de forma deliberada e mal-intencionada. A intenção seria enganar os algoritmos dos buscadores para conseguir mais tráfego e manipular a ordem dos resultados de pesquisa.

A questão é que os motores de busca podem punir essa prática até com a remoção do domínio dos seus índices de resultados!

Então, para evitar quaisquer problemas para o seu lado, saiba mais sobre do que se trata um conteúdo duplicado, o seu impacto em SEO, como identificá-lo e como não ter problemas com ele. Confira nas próximas linhas!

O que é conteúdo duplicado?

O conteúdo duplicado ou repetido é aquele que é copiado e colado integralmente ou com pouquíssimas alterações em outras páginas.

A duplicação pode acontecer dentro de um mesmo domínio ou espalhado para outros, podendo ser criados, inclusive, por uma mesma pessoa ou grupo para manipular os algoritmos dos buscadores.

Mas, nem sempre, o conteúdo repetido é um problema grave.

Pode acontecer do seu site, por exemplo, em meio a dezenas de conteúdos originais, resolver copiar e colar uma matéria publicada por um portal de notícias da sua área.

Os algoritmos do Google, por exemplo, são inteligentes o suficiente para detectar essa prática como uma exceção.

Os press releases divulgados por assessorias de imprensa ou consultorias de Relações Públicas e compartilhados por diversos sites também são exemplos de conteúdos duplicados.

O conteúdo duplicado também pode surgir de erros os quais as pessoas com menos intimidade com programação podem não detectar, como quando um mesmo conteúdo é exibido em http://www.seusite.com/pagina/ e http://seusite.com/pagina/.

Para você e para o público, pode até parecer a mesma coisa, mas para os algoritmos dos motores de busca são duas páginas diferentes. Portanto, conteúdo repetido.

Quer saber outras formas de descobrir se você está duplicando conteúdo ou se está sendo uma vítima disso? Então veja a seguir!

Como identificar um conteúdo duplicado?

1. Verificando as variações do seu domínio

A questão dos sites abertos com ou sem “www” é somente um de muitos exemplos de duplicações que ocorrem por variações de um mesmo endereço.

As URLs mal formadas, com query strings ou com outras pequenas variações também podem levar a incidência de conteúdos repetidos. Para você ter uma ideia mais clara, acompanhe os exemplos a seguir:

  • o mesmo conteúdo sendo acessado em http://www.seusite.com/pagina/ e http://seusite.com/pagina?sessionid=123;
  • o mesmo material sendo exibido em http://www.seusite.com/página/ e http://www.seusite.com/pagina/ (diferença por acentuação);
  • a mesma página sendo acessada em http://www.seusite.com/pagina/ e https://www.seusite.com/pagina.

2. Detectando títulos e meta tags duplicadas

Se você tiver uma conta no Google Search Console, você pode identificar quantas e onde estão as duplicações em títulos e meta descrições em seu domínio. Para isso, clique na aba “Aspectos da pesquisa” e depois em “Melhorias de HTML”.

Mesmo que o conteúdo seja diferente, a duplicação excessiva de títulos e meta descrições podem gerar competição interna entre páginas distintas.

3. Vendo a existência de versões de impressão para as páginas

Muitos sites costumam utilizar duas versões para uma mesma página: a original e uma específica para impressão.

Essa segunda é preparada para aparecer de forma otimizada e mais atrativa nos motores de busca. Nela, são alterados, geralmente, os títulos, URLs e meta descrições das páginas.

Se o Google ou qualquer outro buscador não forem avisados sobre qual versão deve receber a autoridade dos acessos, então a duplicidade estará explícita.

4. Conferindo os resultados das páginas internas de busca

Sabe os e-commerces, sites ou blogs que possuem aquele campo de busca para os visitantes procurarem por algum produto ou conteúdo?

Então, por mais que eles pareçam úteis e inofensivos, o problema acontece quando as pessoas resolvem procurar por termos que não gerem quaisquer resultados.

Por exemplo, uma pessoa usa o campo de busca de um site sobre marketing para pesquisar por “objetivos SMART” ou “SEO local”. Se o site ainda estiver em fase inicial, pode ser que não tenham textos que falem sobre esses temas e, por isso, não sejam apresentados resultados para essas buscas.

A duplicação, nesse caso, acontece porque os títulos ou os textos de “não há resultados para…” são padrões para pesquisas malsucedidas. São muitos links gerados a partir do diretório de busca com o mesmo conteúdo.

5. Utilizando o Copyscape e outras ferramentas

O Copyscape é uma ferramenta utilizada para verificar a existência de fraudes e duplicações de conteúdos. Nele, por meio da URL do seu site, você pode detectar quais outras páginas estão repetindo o seu conteúdo.

O Siteliner, por sua vez, vai ajudar a identificar quantas e quais são as duplicações existentes dentro do seu próprio domínio. Além disso, a ferramenta fará um diagnóstico sobre a saúde dos seus links, as URLs não rastreadas e sobre a velocidade de carregamento do site.

Já o Google Search Console também pode ser útil com os seus rastreadores de conteúdo, como os arquivos robots.txt, que mapeiam o seu site e verifica a qualidade dos links indexados pelo Google.

Como isso afeta o SEO?

Antes de partirmos para a resolução dos problemas causados pelos conteúdos duplicados, é importante entendermos quais são essas consequências e como elas impactam o SEO de um site.

Os buscadores podem escolher uma outra página para atribuir autoridade

Pense em uma mesma página que pode ser aberta tanto em http:// quanto em https://. Caso não seja feita uma indicação ao motor de busca sobre qual é a versão preferida, os algoritmos decidirão qual é a “melhor” versão para o público. Logo, teríamos uma concorrência interna, certo?

Agora, imagine se o conteúdo duplicado for detectado em dois domínios diferentes?

Se você for o produtor original do material, deve assegurar que os sites distribuidores façam referência à sua página.

Caso isso não aconteça, ficará a critério dos buscadores decidir uma versão melhor, que poderá não ser a sua.

Os motores de busca também podem dividir a autoridade entre o seu site e as páginas que replicaram o conteúdo, o que resultaria em perda de posições nos resultados de busca para todos os envolvidos.

Os motores de busca podem não saber qual versão exibir

Normalmente, os buscadores dão preferência aos conteúdos que são indexados primeiros. No entanto, nem sempre isso acontece, principalmente se os materiais da página forem duplicados em muitos outros domínios.

Se a duplicação acontecer internamente, cabe a você indicar ao Google, por exemplo, qual é a versão canônica (original/preferencial).

Se a repetição for externa, a solução é identificar os sites e entrar em contato com seus administradores para retirarem a atribuição de autoridade da página ou redirecionarem para o seu site.

Os motores de busca podem remover o site do seu índice de resultados

Essa punição é a mais grave para quem faz do conteúdo duplicado uma prática maliciosa. Ainda assim, você deve se preocupar com isso?

E a resposta é sim! Se você trabalhar deliberadamente com mais conteúdos duplicados do que originais, é bom rever sua estratégia para evitar um prejuízo dessa gravidade com o seu site.

Caso você utilize o Siteliner para verificar as duplicações em seu site, poderá notar um dado interessante nos resultados de conteúdos duplicados: os sites possuem, em média, 15% de conteúdos repetidos.

Isso quer dizer que é possível manter uma parcela de conteúdos duplicados em um site? Sim, é possível! Não são todos os conteúdos repetidos que devem ser eliminados.

Afinal, existem recursos necessários, como as tags de pesquisas internas, que mais ajudam a melhorar a experiência de navegação do público do que prejudicam o SEO.

Então, quais são as melhores maneiras de gerenciar a incidência de conteúdos repetidos? É o que veremos a seguir!

Como lidar com essa situação?

1. Faça redirecionamentos 301

Também conhecidos como Redirecionamentos Permanentes, eles são feitos em seu servidor, mais especificamente no arquivo .htaccess, para redirecionar os visitantes que acessaram uma página por uma versão alternativa para uma página específica – de preferência, a que você quer atribuir autoridade.

Com esse redirecionamento inteligente, tanto os usuários quanto os robôs dos motores de busca são remanejados automaticamente para uma única versão da página.

Isso ajudará a diminuir bastante a competição interna pela classificação nos resultados de pesquisa.

Detalhe importante: essa prática costuma ser muito usada em sites que estão mudando de domínio, mas não querem perder o tráfego e a autoridade perante os motores de busca.

2. Use as Canonical tags

Essas tags são uma alternativa mais rápida de implementação do que os redirecionamentos 301. O seu efeito é parecido, porém ela é inserida diretamente no código HTML de cada página.

Além do mais, no redirecionamento permanente, o conteúdo duplicado é eliminado, já que as páginas não originais levarão o público e os algoritmos para apenas uma versão.

Na canonical tag, a duplicação continua, mas somente uma página recebe a autoridade dos motores de busca.

A aplicação dessa tag deve ser feita nas variáveis das páginas originais e segue o seguinte modelo:

<head> <link rel=”canonical” href=”http://www.seusite.com/versao-canonica-da-pagina/” />

3. Utilize a tag noindex, follow

Essa tag executa uma função inversa ao do redirecionamento 301 e da canonical tag. Aqui, seu papel é mostrar para os motores de busca que eles podem rastrear uma página específica, mas não devem indexá-las em seus resultados de pesquisa.

Essa meta deve ser adicionada em diretórios de busca, o que eliminaria, de vez, os problemas com indexação de páginas para buscas sem resultados.

Você também pode pedir para os administradores de outros sites incluírem essa tag nos conteúdos duplicados do seu site. Esse é um direito seu, pois sem o uso do noindex ou uma referência explícita ao seu site na página, fica caracterizado o plágio.

4. Crie releituras de outros artigos e notícias

Quando você ler um conteúdo em um outro site e o achar interesse de replicar em sua página, prefira criar uma versão original.

Isso pode até dar mais trabalho, mas evita qualquer tipo de problema com duplicação de conteúdo.

Além do mais, os seus leitores podem até preferir uma releitura com cases da sua empresa, suas opiniões e/ou com mais detalhes.

5. Encurte os posts em páginas de índice

Você já acessou um blog que, em sua página inicial, mostra os posts mais recentes na íntegra? Além de serem páginas exaustivas para ler e mais lentas para carregar, elas também caracterizam conteúdo duplicado.

Por isso, o recomendável é optar por resumos das publicações. Assim, você evita a duplicação, torna a navegação mais agradável e atiça a curiosidade do leitor, fazendo-o navegar por mais páginas e durante mais tempo.

6. Escolha uma versão preferida para o seu domínio

Você se lembra das duplicações que ocorrem por http:// e https:// ou pelos links que contenham versões com ou sem “www”?

Então, saiba que é possível definir uma versão preferida para o seu site. Quando você utiliza o Google Search Console, você pode fazer essa escolha e, dessa maneira, fazer com que somente uma versão receba a autoridade do Google.

Além disso, os relatórios de tráfego e conversões passam a ser centralizados na versão indicada ao Google.

7. Monitore a distribuição do seu conteúdo

Se você costuma trabalhar com press releases ou já possui um histórico de replicações dos seus conteúdos, não deixe de acompanhar as atividades dos sites que distribuem seus materiais.

É muito relevante manter uma boa relação com os administradores de outras páginas. O foco é fazer eles referenciarem o seu site ou abrirem mão da indexação nos motores de busca.

Para contornar essa situação e não precisar apelar para denúncias ao Google, tente negociar com eles a produção de guest posts ou outros tipos de parcerias de marketing.

Enquanto umas soluções exigem criatividade e capacidade analítica, outras demandam um certo conhecimento de programação.

Por isso, é bom ter por perto algum desenvolvedor ou outro profissional de marketing ou T.I. que entenda de códigos e tags.

Em suma, conteúdo duplicado é um problema que só incomoda se ocorrer em excesso. Ele não é tão simples de ser gerenciado, mas se for feito seguindo os passos corretos, não prejudicará o ranqueamento do seu site.

No começo, identificá-lo e evitá-lo pode até ser um pouco complicado. Mas, com o tempo, você se acostumará com os códigos, tags, ferramentas e práticas necessárias para controlar os danos dos conteúdos repetidos.

O conteúdo duplicado é um dos elementos que pioram o posicionamento de um site nos motores de busca. Se você tem a curiosidade de conhecer os outros, então confira o nosso post com os 200 principais fatores de rankeamento do Google e alcance o topo!