Aller au contenu

Duplicate content - Format PDF et version HTML


chantal16

Sujets conseillés

Bonjour,

Je souhaiterais mettre le même document en format PDF, ainsi qu'en version HTML. Est-ce que je risque d'être en duplicate content pour les moteurs de recherche ?

Modifié par olitax
Merci d'utiliser le gras et la couleur avec modération ;-)
Lien vers le commentaire
Partager sur d’autres sites

Tu auras du mal à insérer une balise "canonical" dans un pdf ;)

Cela étant dit, le seul risque serait de voir un contenu privilégié par rapport à l'autre. Je pense qu'un moteur de recherche privilégiera la version HTML quoi qu'il arrive.

De plus, j'imagine que tu as plus de liens entrants vers la page, donc ça ne devrait pas poser de problème.

Pour résumer, je pense que la version PDF passera en duplicate content. Ce n'est pas pénalisant, vu que ça n'influera pas sur le positionnement de l'autre page.

Lien vers le commentaire
Partager sur d’autres sites

Est-ce que je risque d'être en duplicate content pour les moteurs de recherche ?

Non, je pense que Google gère bien les fichiers PDF que les pages html, cependant pourquoi ne pas mettre les liens vers les pdf en nofollow, ou les interdire via robots.txt ! pas la peine d'indexer les deux je suppose !

Lien vers le commentaire
Partager sur d’autres sites

Tu auras du mal à insérer une balise "canonical" dans un pdf ;)

Cela étant dit, le seul risque serait de voir un contenu privilégié par rapport à l'autre. Je pense qu'un moteur de recherche privilégiera la version HTML quoi qu'il arrive.

De plus, j'imagine que tu as plus de liens entrants vers la page, donc ça ne devrait pas poser de problème.

Pour résumer, je pense que la version PDF passera en duplicate content. Ce n'est pas pénalisant, vu que ça n'influera pas sur le positionnement de l'autre page.

Merci pour ta réponse. J'aurais qd même préféré que rien ne passe en duplicate content, mais si on ne pt pas faire autrement...

Non, je pense que Google gère bien les fichiers PDF que les pages html, cependant pourquoi ne pas mettre les liens vers les pdf en nofollow, ou les interdire via robots.txt ! pas la peine d'indexer les deux je suppose !

J'ai bien pensé au no follow, mais dans ce cas le texte du lien, qui contient des mots-clés, ne sera pas pris en considération, je pense ? Ce serait dommage, qd on voit leur importance pour le positionnement.

Lien vers le commentaire
Partager sur d’autres sites

J'ai bien pensé au no follow, mais dans ce cas le texte du lien, qui contient des mots-clés, ne sera pas pris en considération, je pense ? Ce serait dommage, qd on voit leur importance pour le positionnement.

et bien je dirais au contraire, c'est quoi que tu veux positionner ton html ou ton pdf. la logique voudrait que ce soit le html, donc si ton anchor text du lien vers le pdf n'est pas optimisée je dirais tant mieux

Lien vers le commentaire
Partager sur d’autres sites

C'est la page d'accueil sur le site qui serait mieux positionnée, si elle comporte un plus grand nombre de mots-clés dans les textes des liens vers les fichiers pdf.

Autrement, ce sont les pages html correspondant aux documents pdf que je souhaite positionner

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...