Aller au contenu

Indexation de contenu agrégé


Guest PierreLannoy

Sujets conseillés

Guest PierreLannoy

Bonjour à tous !

Cela fait quelques temps que je suis inscrit ici, mais ma participation s'était limitée, jusqu'à maintenant, à la consultation des forums.

Si je viens poster aujourd'hui, c'est que je fais face à une problématique qui me dépasse un peu et j'apprécierai que les "spécialistes" des moteurs de recherche qui fréquentent le hub puisse m'aider à faire la part des choses entre légende urbaine et vérité. (ceci dit même ceux qui n'ont qu'une connaissance toute relative du sujet en savent déjà certainement plus que moi et peuvent donc m'aider à y voir plus clair)...

Mais trève de bavardage, voici mon "problème" :

J'ai lancé il y a peu de temps (3-4 semaines) un site (http://www.freshblog.net) dont l'objet est de faire de l'agrégation de contenu thématique : chaque "canal thématique" offre, en continu, les articles des blogs francophones sur le thème en question. La partie technique n'a pas été trop difficile (pour ceux que ça interresse, n'hésitez pas à me contacter), mais là où le bas blesse c'est sur la partie référencement, ou plutôt indexation : bien évidemment, balises meta, sitemaps, ... tout est ok et opérationnel. Mais rien à faire, Google indexe très mal mon site.

Voici donc le fond de ma question : j'ai lu quelque part (mais évidemment, je suis incapabale de remettre la main sur l'article) qu'entre sites, google n'indexait pas des sites de contenu identique. Or, c'est justement le principe de mon site. Puisque mon site ne fait qu'être "mirroir" d'autres sites, cela veut-il dire qu'il ne sera jamais correctement indexé par Google ? Comment font les autres ?

Merci à ceux d'entre vous qui pourraient m'apporter leurs lumières et autres pistes de réflexion pour améliorer, éventuellement, l'indexation de mon site....

Pierre.

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Pour avoir fait le même genre de site il y a assez peu de temps je peux te garantir qu'il n'y aucun problème d'indexation si les moteur peuvent facilement suivre tes liens. Ton site se démarque du mien par le fait que j'ai cependant beaucoup plus linké que toi les pages entres elles et que je n'ai pas opté pour la stratégie des sous-domaines qui je pense a un peu tendance à disperser les efforts.

Quoi qu'il en soit je ne sais pas ce que tu as commencé à faire niveau du linking vers ton site mais un bon gros partenariat te permettra surement de faciliter ton indexation...

En espérant t'avoir rassuré

Lien vers le commentaire
Partager sur d’autres sites

Guest PierreLannoy

Bonjour !

Pour avoir fait le même genre de site il y a assez peu de temps je peux te garantir qu'il n'y aucun problème d'indexation si les moteur peuvent facilement suivre tes liens.

Bon voilà une première bonne nouvelle (d'autres webmasters pour confirmer ?). Et pour le suivi des liens, ça à l'air de fonctionner mais comment en être certain ?

Quoi qu'il en soit je ne sais pas ce que tu as commencé à faire niveau du linking vers ton site mais un bon gros partenariat te permettra surement de faciliter ton indexation...

Le partenariat est effectivement "dans le tube..."

En espérant t'avoir rassuré

Ca commence un peu, Merci !

Modifié par PierreLannoy
Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Ton site est indexé par Google, mais souffre d'un gros problème: toutes tes pages, sauf une, sont dans l'index complémentaire (vois la mention "Résultat complémentaire" à côté de l'URL dans les pages de résultats de Google): http://www.google.fr/search?hl=fr&rlz=...rcher&meta=

Dans ces conditions, elles n'ont aucune visibilité dans Google. Le trafic généré par Google sur le site est sans doute proche de zéro.

Ton site est victime de ce problème "par construction", dans son principe même. Le contenu dupliqué est le plus sûr moyen d'envoyer un site dans cet enfer qu'est l'index complémentaire ;)

Bien sûr il y a des exceptions (l'exemple de skippy?). Avec un site un peu ancien, puissamment backlinké, on peut s'en sortir (et sortir dans google) avec du contenu dupliqué. Le principe est que c'est le plus fort qui "tue" les autres. Si ton site est suffisamment puissant, c'est lui qui peut sortir dans google au détriment des sites auxquels il a piqué le contenu (c'est ailleurs une technique de déréférencement des concurrents très classique).

Comme le dit skippy, ton problème est sans doute agravé par les sous domaines: au lieu d'avoir un site avec beaucoup de pages, google considère que tu as plusieurs sites avec peu de pages, donc peu puissants.

Tu mentionnes l'existence d'un sitemap. Ces sitemap xml sont à mon avis le plus gros piège tendu par google aux webmasters. Une page doit être indexable naturellement par ses backlinks. "Forcer" l'indexation de pages trop faiblement linkées par un sitemap est le meilleur moyen de les envoyer direct dans l'index complémentaire (manque de "PR juice" comme disent les anglo saxons).

En plus ce sitemap gêne au diagnostic de ton site. Tes pages ont-elles été indexées naturellement ou seulement grace au sitemap? Impossible à dire a priori. La première chose à faire sur ton site amha: le sitemap => à la poubelle ;)

Dernier point sur ta page d'accueil: tu as créé toi même un contenu dupliqué entre le www et l'url sans www:

http://www.google.fr/search?q=%22Bienvenue...29&filter=0

Résultat: les 2 sont dans l'index complémentaire. A corriger par une redirection 301 de l'une vers l'autre.

Lien vers le commentaire
Partager sur d’autres sites

Guest PierreLannoy

Bonjour Jan et merci pour cette analyse "à chaud".

Si je veux résumer (et reformuler aussi, parceque le néophyte que je suis en a besoin), la presque totalité des pages de mon site sont indéxées dans "l'index de seconde zone" de Goggle. Pour tenter d'améliorer ça il faudrait :

- revoir la stratégie des sous-domaines (!!!)

- oublier les sitemaps

- augmenter le nombre de backlinks

- gérer le problème du nom de domaine avec et sans www

C'est à peu près ça ?

Lien vers le commentaire
Partager sur d’autres sites

C'est effectivement ce que je commencerais par faire.

Subsiste ensuite le problème de fond: comment faire référencer des pages au contenu dupliqué?

Il faudrait sans doute essayer d'ajouter une part de contenu original dans ces pages. Quelques pistes: un résumé ou commentaire que tu pourrais ajouter sur chacun des articles agrégés, ou encore ouvrir tes pages aux commentaires des visiteurs de ton site.

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...