Aller au contenu

Referencement d'un site multilingue


-ZN-

Sujets conseillés

Bonjour,

Je suis en train de bosser sur un site multilingue, et je viens de me rendre compte que j'ai oublié d'ajouter la balise lang ... aide-t-elle vraiment au referencement des sites multilingues?

Les differents bots ont l'air de bien crawler le site, mais je me demande si la reconnaissance des langues est "automatique" ...

J'ai une autres question plus particuliere, sur certaines pages du meme site multilingue je peux avoir jusqu'a 3 langues sur la meme pas, dans ce cas la, mieux vaut-il ne pas utiliser la balise lang?

Merci pour vos suggestions,

ZN

Lien vers le commentaire
Partager sur d’autres sites

Il y a plusieurs théories, pour ce qui est de la détermination de la langue utilisée sur une page :

- L'une d'elles est de dire que le robot se sert de l'adresse IP du site, pour déterminer sa zone géographique. Ainsi, un site (quelque soit sa langue) hébergé en angleterre serait mieux noté en Angleterre qu'un site hébergé en Italie. L'inverse est vrai aussi. Un site avec une IP localisée en Italie sera mieux noté sur les moteurs de recherche italiens que s'il est localisé au Portugal.

- L'autre théorie est de dire que le robot se sert des mots contenus dans la page, pour déterminer l'appartenance géographique du site. Un site francais avec un texte anglais sortirait mieux qu'un site anglais avec un texte identique mais en francais, sur un moteur de recherche anglais.

Anonymus.

Lien vers le commentaire
Partager sur d’autres sites

Je fais partie des defenseurs des 2 théories simultanées - et euh bon a priori elles se vérifient toutes les 2 - :P

A priori les moteurs se servent de dictionnaires pour determiner la langue du site donc si les version ne sont pas clairement séparées et bien le moteur se mélange les pinceaux et ne sait plus dans quelle langue faire apparaitre le site.

Le top ce serait plusieurs sites "monolingue". un .fr pour le site francophone et un .com pour le site anglophone par exemple.

si ce n'est pas possible je pencherait pour un sous domaine en francais et un sous domaine en anglais (exemple toujours). Cette solution permet en plus de travailler les Url avec la bonne langue.

Ensuite c'est vrai que faire héberger son site dans la zone géographique qu'on cible c'est mieux aussi. mais bon c'est pas forcément évident au niveau de la logistiques :wacko:

Bon après la balise "lang" mets la elle ne eut pas faire de mal de toute façon.

J'ai une autres question plus particuliere, sur certaines pages du meme site multilingue je peux avoir jusqu'a 3 langues sur la meme pas, dans ce cas la, mieux vaut-il ne pas utiliser la balise lang?

Personellement je te conseille de ne jamais metre plusieurs langue sur la même page même avec une balise "lang" !

Voila

Que la force soit avec toi !

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

D'après mes tests, la balise META LANGUAGE n'est pas prise en compte par Google. Il est certain que Google analyse lui-même le contenu des pages. J'ai fait un résumé de mes observations dans l'article Google - Pages francophones.

Il vaut mieux éviter les pages en plusieurs langues. J'ai vu au moins un cas où Google avait reconnu correctement la présence de plusieurs langues dans une page, mais je suis convaincu que faire des pages multilingues, c'est s'exposer à énormément d'erreurs.

Il y a aussi souvent confusion chez les webmasters entre reconnaissance de la langue et reconnaissance de la "nationalité" d'un site. J'ai fait un autre article pour essayer de sortir de ces malentendus: Google - Pages : France / Géolocalisation d'un site web.

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Merci pour ces renseignements, je pensais modifier la structure de mon site, je crois que je vais attendre un peu, histoire de voir la reaction des moteurs de recherche ... un peu d'experimentation ne peut pas faire de mal :)

Je vous tiendrai au courant, je pense observer pendant un mois avant de modifier la structure...

a bientot,

ZN

Lien vers le commentaire
Partager sur d’autres sites

Pour ma part, le simple attribut lang="fr" ou lang="en" a suffit à me faire gagner une dizaine de places (oui oui) à l'époque du concours de positionnement mangeur de cigogne et encore il y a quelques temps pour seraphim proudleduck ..

Donc il ne faut pas se servir de la balise <meta language qui elle effectivement ne sert à rien, mais bien d'un <html lang="fr"> pour améliorer son référencement sur des requêtes francophones ou "en" pour les anglophones.

N'hésites pas à tester, les résultats sont édifiants ;):P

Lien vers le commentaire
Partager sur d’autres sites

Donc il ne faut pas se servir de la balise <meta language qui elle effectivement ne sert à rien, mais bien d'un <html lang="fr"> pour améliorer son référencement sur des requêtes francophones ou "en" pour les anglophones.

N'hésites pas à tester, les résultats sont édifiants ;):P

Bonjour,

Trèèèèèèèès intéressant. Je viens de mettre <HTML LANG="fr-BE"> sur des pages où Google se trompe actuellement dans la reconnaissance de langue. Je vous tiens au courant quand l'ami Googlebot sera venu les relire.

Jean-Luc

Modifié par Jeanluc
Lien vers le commentaire
Partager sur d’autres sites

Merci Sid je vais essayer de modifier la structure de mon site des que possible pour ne pas mélanger toutes les langues ;)

Lien vers le commentaire
Partager sur d’autres sites

Hello,

J'ai lu il y a bien longtemps qu'il existe un moyen astucieux pour déterminer la langue utilisée sur une page. Au lieu de comparer les mots présents sur une page avec des dictionnaires, il suffit de compter le nombre d'occurences des lettres. Le nombre de A, de B, de C, etc... Grâce à ce système il est possible d'attribuer à chq langue une signature bien spécifique.

Evidement, il faut un texte d'une bonne taille pour obtenir une signature fiable.

Croyez moi ou non, ça marche...

Mais pour en revenir à la discussion, j'aimerais beaucoup que les tests de Jeanluc avec une balise <HTML LANG="fr-BE"> soient concluant. C'est la porte ouverte à fr-CH, fr-CA, etc... et peut être le référencement sur les Google respectifs... Inespéré?

Merci Jeanluc de nous tenir au courant.

Modifié par XopheWH
Lien vers le commentaire
Partager sur d’autres sites

  • 2 semaines plus tard...
Bonjour,

Trèèèèèèèès intéressant. Je viens de mettre <HTML LANG="fr-BE"> sur des pages où Google se trompe actuellement dans la reconnaissance de langue. Je vous tiens au courant quand l'ami Googlebot sera venu les relire.

Jean-Luc

Mauvaise nouvelle : ça ne marche pas :huh:

Pour vous en convainvre, examinez cette recherche Google sur les pages d'un de mes sites soi-disant en "hollandais". Les "caches" sont toutes datées du 26 mai, sont évidemment en français et contiennent le <HTML LANG="fr-BE">.

Je pourrais faire un nouvel essai avec <HTML LANG="fr">, mais ce serait tout de même étonnant que le problème soit à ce niveau.

Jean-Luc

Modifié par Jeanluc
Lien vers le commentaire
Partager sur d’autres sites

Je pourrais faire un nouvel essai avec <HTML LANG="fr">, mais ce serait tout de même étonnant que le problème soit à ce niveau.

Je me réponds à moi-même... :fou:

Je viens de regarder la recherche limitée aux pages en anglais sur un site de guilcorp et manifestement, pour Google, cette page en cache est en anglais, même si elle contient <html lang="fr">.

Jean-Luc

Modifié par Jeanluc
Lien vers le commentaire
Partager sur d’autres sites

Le top ce serait plusieurs sites "monolingue". un .fr pour le site francophone et un .com pour le site anglophone par exemple.

<{POST_SNAPBACK}>

J'ai l'impression que cela peut être intéressant de mettre la version française en .fr pour qu'elle sorte mieux sous Google français mais pas forcément l'inverse...

Je m'explique:

Soit un .com qui porte le site en 2 langues. Le site sort bien en Google français mais pas forcément très bien sous Google.com .

Vais-je améliorer son classement si je ne laisse que la version anglaise sur le .com ?

Autrement dit: Est-ce que Google.com privilègie les sites en anglais ou est-ce qu'il prend tout ?

Sinon, Jean-Luc, test test sont intéressants...

Lien vers le commentaire
Partager sur d’autres sites

Autrement dit: Est-ce que Google.com privilègie les sites en anglais ou est-ce qu'il prend tout ?

Le probleme n'est pas de l'avantage d'un . com ou d'un .fr dans Google.com.

De mon expérience je dirais que google utilise des dictionnaires pour déterminer la langue. Donc un site multilingue fait que Google se mélange un poil les pinceaux pour determiner le langage surtout si le site est mal foutu au niveau de son arborescence ( et puis je ne pense pas qu'a google parce qu'a l'étranger il est présent mais pas autant que chez nous).

Donc a priori si tu fais 2 sites monolingue (il existe ce mot monolingue ??? :huh: pô grave j'ai le droit d'inventer des mots si je veux :smartass: ). Le problème est réglé !

En plus ça te permet de bosser sur toute la structure de ton site par langue (nom de domaine, url etc...) voir même si tu es très conciencieux et que tu as les moyens tu peux les faire héberger la version étrangère dans le pays étranger etc ... mais bon la on est dans le monde de mickey le ciel est bleu et les oiseaux chantent etc ... bref un monde parfait (comme celui d'illona !). :fete:

Mais bon je vois d'ici tout le monde me dire "Ben oui ça c'est sur ! C'est toujours mieux d'avoir 2 sites pour 2 langues et t'a pas inventé le fil a couper l'eau chaude..." :nerd:

ce qui dans l'absolu ne serait pas faux...

Reste que Pour quelqu'un qui aurait les moyens, les compétences techniques et les infrastructures ( parce que 2 sites c'est un de plus a administrer, mettre a jour etc ... eh oui !) c'est la meilleure solution pour avoir autant de chance de ressortir dans une langue et dans l'autre si on ne teint pas compte de la concurrence.

Voila je sais c'etait un peu long mais bon faut c'qui faut ! :shutup:

Lien vers le commentaire
Partager sur d’autres sites

De mon expérience je dirais que google utilise des dictionnaires pour déterminer la langue. Donc un site multilingue fait que Google se mélange un poil les pinceaux pour determiner le langage surtout si le site est mal foutu au niveau de son arborescence ( et puis je ne pense pas qu'a google parce qu'a l'étranger il est présent mais pas autant que chez nous).

Donc a priori si tu fais 2 sites monolingue (il existe ce mot monolingue ??? :huh: pô grave j'ai le droit d'inventer des mots si je veux :smartass: ). Le problème est réglé !

Bonjour,

Ton point de départ n'est pas correct. Google ne détermine pas la "langue d'un site", mais la "langue d'une page". Il le fait page par page, j'en suis convaincu et c'est assez logique.

Pour la méthode qu'il utilise, je suis d'accord avec toi; je pense qu'il utilise des "dictionnaires" et qu'il se base sur la probabilité qu'une page qui contient 200 mots français et 3 mots italiens est probablement en français. Enfin, c'est probablement pas exactement comme ça, mais ça correspond quand même assez bien au fait qu'en général il détermine correctement la langue, mais qu'il se plante si la page contient certains mots étrangers ou techniques.

monolingue => unilingue ;)

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

Mais bon je vois d'ici tout le monde me dire "Ben oui ça c'est sur ! C'est toujours mieux d'avoir 2 sites pour 2 langues et t'a pas inventé le fil a couper l'eau chaude..." :nerd:

ce qui dans l'absolu ne serait pas faux...

<{POST_SNAPBACK}>

Moi, cela ne me semble pas évident.

Quand je vais taper le nom de la société, qu'est ce que Google va me sortir ? Les 2 sites ? Et il va forcément y avoir du quasi duplicate content sur certaines pages (des pages avec peu de texte par exemple).

Je cherche des exemples de sites avec chaque version sur un NDD particulier, mais j'ai du mal à en trouver et ceux que j'ai trouvé ne sortent pas bien du tout (mais est-ce pour cela, ce n'est pas sûr).

Lien vers le commentaire
Partager sur d’autres sites

Quand je vais taper le nom de la société, qu'est ce que Google va me sortir ? Les 2 sites ? Et il va forcément y avoir du quasi duplicate content sur certaines pages (des pages avec peu de texte par exemple).

- Alors effectivement pour une requête avec le nom de domaine du site la situation peut être chouillat problématique et il y a un risque de cybersquatting (mais juste chouillat) :whistling:

- Par contre le risque de duplicate entre 2 pages de 2 sites en 2 version linguistques différentes est exactement le même qu'entre 2 versions linguistiques différentes d'un même site (euh la je vois pas trop où est le probleme :huh: ).

Quant au souci des pages avec peu de texte ... A priori si elles ont peu de texte elles ne sont pas destinées à se positionner dans les outils de recherche

euh voila... le débat restes ouvert !

Lien vers le commentaire
Partager sur d’autres sites

- Par contre le risque de duplicate entre 2 pages de 2 sites en 2 version linguistques différentes est exactement le même qu'entre 2 versions linguistiques différentes d'un même site (euh la je vois pas trop où est le probleme :huh: ).

<{POST_SNAPBACK}>

J'aimerais en être certain... Il me paraît moins risqué d'avoir des pages assez proches dans le même site que dans deux sites différents.

On ne ne connaît pas l'algorithme utilisé par google pour mesurer les similitudes entre deux sites : à partir de combien de pages similaires considère t-il qu'il s'agit du même ?

Si on prend l'exemple d'un site où l'on peut cliquer sur toutes les images pour les voir en gros plan, on peut se poser des questions...

Quant au souci des pages avec peu de texte ... A priori si elles ont  peu de texte elles ne sont pas destinées à se positionner dans les outils de recherche

Le jour où Google respectera toujours la balise "noindex", ces pages ne seront effectivement pas indexées. Pour l'instant, elles le sont. :angry:

Lien vers le commentaire
Partager sur d’autres sites

Le jour où Google respectera toujours la balise "noindex", ces pages ne seront effectivement pas indexées. Pour l'instant, elles le sont. 

La je pense que nous ne parlons pas de la même chose. Je parles de positionnement et pas d'indexation.

J'aimerais en être certain... Il me paraît moins risqué d'avoir des pages assez proches dans le même site que dans deux sites différents.

On ne ne connaît pas l'algorithme utilisé par google pour mesurer les similitudes entre deux sites : à partir de combien de pages similaires considère t-il qu'il s'agit du même ?

La je demande l'arbitrage des autres participants... Avis a tous! :P

Cependant dans la mesure ou il y a plusieurs sites dans plusieurs langues je pense que de nombreux paramètres qui font que les pages sont assez différentes pour ne pas être considérées comme identiques...

Lien vers le commentaire
Partager sur d’autres sites

Hello,

que pensez-vous de mettre plusieurs balises "Meta Description" sur la page Index ? (autent que de langue)

par exemple :

<meta name="description" lang="fr" content="Titre de la page">

<meta name="description" lang="en" content="title of your page">

<meta name="description" lang="es" content="no abla espanola">

ensuite chaque langue est dans un sous-dossier différent (la gestion est plus "lourde" pour des sous-domaines, si on a plein de liens interne, photos, etc.)

Lien vers le commentaire
Partager sur d’autres sites

Bonjour Xavfun,

Il ne devrait jamais y avoir plusieurs balises META du même type dans une page.

Il y a de très fortes chances que Google et les autres ne regardent que la première META "description".

Jean-Luc

Lien vers le commentaire
Partager sur d’autres sites

oui mais pour un site en 4 langues, je peux pas mettre le descriptif en en français, en anglais, en espagnol, et en allemand, ça donnerais un résultat affreux dans Google quand on lit le descriptif des pages de résultats.

Quelqu'un à déjà fait le test ou c'est moi qui m'y colle ?

Lien vers le commentaire
Partager sur d’autres sites

Hello,

je suis toujours en phase de tests pour un site tout recent, je donnerai les resultats bientot. C'est super de bosser sur de nouveaux projets il y a toujours plein de choses à apprendre :)

Quelques premieres constatations ... sur un site en anglais/espagnol/fr , pas parfaitement structuré (mais c'est intentionnel), les resultats FR remontent mieux (le site est heberge en france). Les resultats ES sortent aussi bien, mais c'est par manque de pages en espagnol. Je suis par contre dans les choux pour les resultats EN, car il y a beaucoup plus de sites (forcemment un site recent peine un peu).

a suivre ...

ZN

Lien vers le commentaire
Partager sur d’autres sites

Pour l'instant le body de mes pages contient de l'anglais, un peu d'espagnol et du francais ... je vais bientot scinder tout ca en trois parties bien distinctes et rajouter les balises indiquant en quelle langue est la page ...

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...