Aller au contenu

Trustrank


Régis

Sujets conseillés

un article qui en parle :

Web spam pages use various techniques to achieve higher-than-deserved  rankings in a search engines results. While human experts can identify spam, it is too expensive to manually evaluate a large number of pages. Instead, we propose techniques to semi-automatically separate reputable, good pages from spam. We first select a small set of seed pages to be evaluated by an expert. Once we manually identify the reputable seed pages, we use the link structure of the web to discover other pages that are likely to be good. In this paper we discuss possible ways to implement the seed selection and the discovery of good pages. We present results of experiments run on the World Wide Web indexed by AltaVista and evaluate the performance of our techniques. Our results show that we can effectively filter out spam from a significant fraction of the web, based on a good seed set of less than 200 sites.

la suite ici ...

Modifié par cendrillon
Lien vers le commentaire
Partager sur d’autres sites

Merci "Cendrillon",

Oups, sacré lecture (lien PDF) que tu m'as fourni...

Selon ton extrait, j'ai compris qu'une équipe de pro, analyse quelques pages et décident ou non une mise à l'écart du site s'il y a truandage (spamming) au niveau de la popularité (PR pour Google).

Pour mieux comprendre (je ne suis pas très doué en anglais), j'ai cherché et trouvé un article qui en parle (en français) :

Certains parlent d'une mise à l'écart basée sur une sélection manuelle de domaines spammeurs (algorithme Trustrank)

L'article complet est ici

Lien vers le commentaire
Partager sur d’autres sites

Salut à tous,

Tiens je l'attendais ce sujet .....

Alors le TR qu'est ce que c'est ?

Et bien (pour moi), le tout nouvel argument de vente de Google (et oui, on en parle moins en ce moment ...).

ALors on lance le TR, tout le monde en parle et on sort la version 1.256 du PR et tout le monde est content.

Google, on parle de lui .... il peut donc s'occuper d'autres choses (pas de sous-entendu)

Les webmaster, je comprend pas j'étais PR7 et je suis PR 4

On en parle et parlera donc encore et toujours sur tous les bons forums du net .....

Si ça c'est pas du WebMarketting alors qu'est ce que c'est ?

A l'instar de GMAIL, c'est limité, ça n'a pas trop d'utilité alors il me le faut.

Sacré technique que de crée de la demande là ou il ne devrait pas y en avoir.

Bon je dérive certes, mais le TR est surement du au fait de tous les abus que l'on connait sur le PR.

En effet, n'importe qui peut à l'heure actuelle afficher un PR6 (ou 10) sur son site pour developper une politique d'échange de liens (en dupant ces petits camarades de jeux).

Tout le monde affiche le PR en temps Réel (pas bon pour Google)

Beaucoup ont trouvé les sources de la ToolBar officielle

etc .....

Google réagit enfin, il l'avait déjà fait en actualisant le PR avec de longs intervalles, maintenant, il passe à l'offensive en créant un nouvel outil dont on va parler encore pendant longtemps ;)

Lien vers le commentaire
Partager sur d’autres sites

Le TrustRank va peut un peu plus loin qu'un simple coup marketing c.klouchi ..

Aprés lecture du document cité plus haut, il s'avère que cette technique de crawl et d'identification de site supprime une part trés importante du spam uniquement grâce à un noyau dur de site qui sont considérés comme des sites 'autorités' (sans allusion à l'algo Hilltop).

Concrètement, quand on voit le ménage que fait Google en ce moment même sur de nombreuses requêtes commerciales, les réponses des serps et leurs variations .. clairement, un nouvel algo a été mis en place qui ne répond plus aux critères que nous avons connu.

Le TrustRank permettrait d'expliquer de nombreux comportements étranges de Google, de là à dire que c'est le principe appliqué, je n'en sais rien, mais ce que je sais, c'est que le traditionnel Pagerank n'obeit plus non plus aux régles du passé. L'indice affiché aujourd'hui est peut être un mix des deux..

Lien vers le commentaire
Partager sur d’autres sites

Je pense que cette idée simple du Trustrank doit certainement être appliquée depuis de nombreux mois par Google...

Google a appris, grâce à l'équipe de Haveliwala, Kamvar et alter à calculer facilement des pageranks "biaisés" à partir d'une "semence" de sites soigneusement choisis. Le Trustrank n'est qu'une nouvelle application du même principe au spam.

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...