Webmaster Hub
Rechercher dans les publications Rechercher:


Spamdexing, pages satellites, cloaking

Le spamdexing est un fléau pour les moteurs de recherche, mais aussi pour les webmasters qui voient des pages étranges squatter des positions enviables dans les pages de résultat. Mais qu’est-ce que le spam ? Comment les moteurs luttent-ils contre la pollution de leurs index ? Cette rubrique regroupe une série d’articles qui font le point sur des techniques obscures, borderline, et sur les techniques utilisées dans les outils de recherche pour les combattre

Les articles récents :

Lutte contre le spamdexing
La détection du Link Spam : un challenge pour les moteurs [3/4]

Le dimanche 10 février 2008
par Cariboo
Les méthodes statistiques et le recours à l’évaluation humaine complètent l’arsenal des moteurs contre le linkspam. Cet article donne un aperçu des techniques utilisées...

Lutte contre le spamdexing
La détection du Link Spam : un challenge pour les moteurs [2/4]

Le dimanche 10 février 2008
par Cariboo
Très tôt, les moteurs ont eu l’idée d’attribuer aux pages web un score de "spam". Ces scores peuvent s’appuyer sur un algorithme de calcul similaire à celui du pagerank.

Lutte contre le spamdexing
La détection du Link Spam : un challenge pour les moteurs [Bibl.]

Le samedi 9 février 2008
par Cariboo
La littérature scientifique sur ce sujet est devenue abondante, d’où la taille de cette bibliographie

Lutte contre le spamdexing
La détection du Link Spam : un challenge pour les moteurs [1/4]

Le vendredi 8 février 2008
par Cariboo
Identifier les manipulations du Pagerank en observant la structure des liens sur le web est possible. De nombreuses méthodes pour y parvenir efficacement ont été inventées et décrites dans des articles et des brevets. Mais elles ont leurs limites et le spamdexing a encore de beaux jours devant lui.

Une tentative de définition du spamdexing

Le dimanche 6 novembre 2005
par Cariboo
Les pages de résultats des moteurs de recherche sont polluées par toute une série de pages web dont la pertinence n’est pas toujours évidente. Ces pages sont parfois générées volontairement, dans le but de squatter des positions sur de multiples mots-clés dans les pages de résultats. Mais tout cela est-il du spam ? Ou de l’optimisation de contenu pour les moteurs de recherche ? Comment déterminer ce qui relève de l’un, ou de l’autre ?