Aller au contenu

Etude sur les pages moteurs [nombres]


Madrileño

Sujets conseillés

Voici un calcul rapide pour savoir le nombre de page et de sites a priori :

Pour les sites utiliser la commande site: pour le savoir :

http://www.google.com/search?q=site%3A

6,770,000,000

http://www.google.fr/search?q=site%3A

6 770 000 000

Résultats identiques entre le le suggest et le fr et aucun sous domaine présent...

Pour savoir le nombre de page utiliser la lettre a :

http://www.google.com/search?q=a

8,000,000,000

http://www.google.fr/search?q=a

8 660 000 000

je rappelle que le chiffre officiel est de :

Searching 8,168,684,336 web pages

Donc nous avons déjà 500 000 pages de plus que le chiffre officiel ...

A savoir que suivant les data-centers le chiffre varie un peu ...

Pour Yahoo maintenant :

la commande site: bien-sur :

http://search.yahoo.com/search?p=site%3A

160,000,000

http://fr.search.yahoo.com/search?p=site%3A

427 000 000

on remarque déjà un changement entre le fr et le us ... peut être une erreur direz vous ... Mais a priori la commande site: n'est pas forcément très pertinente suivant les moteurs a suivre ...

En ce qui concerne la lettre a cela a l'air de bien continuer :

http://search.yahoo.com/search?p=a

11,800,000,000

qui semble un chiffre réaliste ...

http://fr.search.yahoo.com/search?p=a

11 400 000 000

Chiffre réaliste et qui continue de l'être entre le us et le fr ...

A noter que la requête d'avant the ne marche plus pour savoir le nombre de page total ...

Voyons maintenant avec MSN search :

Avec la commande site: voyons :

http://search.msn.com/results.aspx?q=site%3A

1,324,566,487

http://search.msn.fr/results.aspx?q=site%3A

1 357 146 730

Les chiffres sembles faibles quand même mais c'est le dernier moteur arriver ...

Maintenant avec la lettre a :

http://search.msn.com/results.aspx?q=a

2,473,264,711

http://search.msn.fr/results.aspx?q=a

2 620 164 127

Des chiffres assez bas et pas très concordant...

A noter que les cotations en bourse sont disponibles en .com mais pas en .fr ... :lol:

On peut donc voir que pour certains moteurs la lettre a peut être le résultat du nombre de page à peu près qu'ils disposent ( et on peux penser aussi que les pages trouvées sont celles qui sont en lettres comme nous écrivons ... et oui la chine n'utilise pas le a )

A noter que pour a sur :

http://216.239.53.104/

http://216.239.57.104/

sont à : 8 610 000 000

et que pour :

http://216.239.59.104/

http://66.102.11.104/

c'est à : 8 730 000 000

et pour :

http://64.233.171.104/

http://64.233.179.104/

http://64.233.185.104/

sont à : 8 780 000 000

Une montée petit à petit de l'index peut être ...

Pour ce qui est des sites cela peut être utile mais à savoir si le moteur ne prend pas en compte le mot seulement ou pas ...

Ainsi j'ai donc chercher le nombre réel de page depuis la disparition du "the" ...

Qu'en pensez-vous ? :oops:

Si quelqu'un veut continuer à chercher pourquoi pas ;)

ps : l"utilisation de site: ne permet pas de savoir le nombre de site a mon avis mais pour le a il est probable comme je l'ai dit avant que cela soit un chiffre "potable" pour le nombre de pages indexés dans notre style de lettres...

ps 2 : j'avais réaliser cette recherche il y a quelques temps :

on peut noter que depuis le nombre de pages indexés par Google officiellement n'est plus leur priorité mais la pertinence comme au début.

On peut ainsi voir des changement aussi entre l'étude et les résultats actuels mais il serait assez interessant de savoir la manière exacte de trouver le nombre de pages

On note aussi le fait que certaines pages encore dans certains moteurs datent de quelques années ou mois et qui ne sont plus réelles ...

Certains ont remarquer que msn des fois affiche plus de pages pour un site qu'il n'en contient mais on pourrait penser qu'il puisse s'agir de duplicate avec et sans www ...

En fait je recherche plus d'informations sur le thème sur ce forum en complément aux informations que j'ai pu trouver et qui m'ont été fournies

Lien vers le commentaire
Partager sur d’autres sites

Une recherche négative sur un mot improbable donne des résultats supérieurs :

http://www.google.com/search?hl=en&lr=&c2c...q=-fghxghxghxgh

6.68 milliards de pages affiché dans Google

<{POST_SNAPBACK}>

:unsure: l'url m'affiche : 9,680,000,000 :rolleyes:

Etonnant d'ailleurs :

-a : 2,100,000,000

-aa : 9,570,000,000

-aaa : 9,620,000,000

-aaaa : 9,670,000,000

-aaaaa : 9,680,000,000

et après ça ne bouge plus :D

Lien vers le commentaire
Partager sur d’autres sites

Oups j'ai fait une coquille, effectivement c'est bien 9,680,000,000

Tes requetes sur a, aa, aaa ne sont pas indiquées car ces mots existent vraiment.

<{POST_SNAPBACK}>

C'est bizarre quand même que autant de webmasters mettent alors aaa à la suite :unsure: encore aa on peut faire une erreur mais aaa ^_^

On voit de tout sur le web ;)

Lien vers le commentaire
Partager sur d’autres sites

C'est bizarre quand même que autant de webmasters mettent alors aaa à la suite  :unsure:  encore aa on peut faire une erreur mais aaa  ^_^

On voit de tout sur le web  ;)

<{POST_SNAPBACK}>

Pourquoi pas :)

Sinon il y a aussi aaaaa, c'est pour les andouillettes :fou: (et maintenant le hub)

Lien vers le commentaire
Partager sur d’autres sites

C'est bizarre quand même que autant de webmasters mettent alors aaa à la suite  :unsure:  encore aa on peut faire une erreur mais aaa  ^_^

On voit de tout sur le web  ;)

<{POST_SNAPBACK}>

Oui, tu as raison, ca doit être une erreur..

mais Elle est de taille => http://www.google.fr/search?hl=fr&c2coff=1...=cr%3DcountryFR Non ? :whistling:

Lien vers le commentaire
Partager sur d’autres sites

Etonnant d'ailleurs :

-a : 2,100,000,000

-aa : 9,570,000,000

-aaa : 9,620,000,000

-aaaa : 9,670,000,000

-aaaaa : 9,680,000,000

et après ça ne bouge plus

<{POST_SNAPBACK}>

Petit up :

Suite à la série de aaaaaaaaa j'ai chercher à quel moment Google bugais ...

Et surprise :

Pour :

-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

Il y a 9 680 000 000 le même résultat que pour les requêtes avant depuis le -aaaaa on est d'accord ...

Mais si on rajoute un a donc :

-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

On obtient déjà 9 690 000 000

et si on en rajoute un autre le chiffre revient à 9 680 000 000 :fou:

et si je rajoute 8 "a" de plus :

-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa

Tout marche bien et avec un de plus Google répond aucune réponse :fete:

donc à 127 caractères plus "-" google ne répond pas a la requête

Par contre il ne répond pas avec d'autres lettres mais pour -a quand on obtient 9 690 000 000 on n'a pas cette réponse avec les autres lettres à priori ...

J'ai du mal a me comprendre mais je me comprends quelqu'un suis me comprend à par moi-même ? :fou:

Lien vers le commentaire
Partager sur d’autres sites

En même temps ce n'est que des aproximations.

En tapant sur google.fr : -gfrsegsdrtgsdgrgfsdrfqsdfrqdsf

j'ai 9 660 000 000 pages

avec : -aaaaa

j'ai également 9 660 000 000 pages

pourtant si je tape gfrsegsdrtgsdgrgfsdrfqsdfrqdsf je n'ai aucune page, si je tape aaaaa j'en ai 2 460 000

Cela dit 2 460 000 pages, ça ne fait que 0,025% d'erreur

Modifié par Urban
Lien vers le commentaire
Partager sur d’autres sites

Bonjour "Madrileño",

Ton étude me rappelle étrangement ce que nous pouvons lire dans ce post : Requête "spéciale" sur Google du 28/03/05... et de l'utilisation de la commande "-asdf*(***)...." ou autre. Un outil permettait à l'époque de "visualiser" : "Star Tester" ou quelque chose du genre...

De mémoire, je n'ai lu que des supputations sur ce phénomène... et beaucoup d'encre coulée...

Lien vers le commentaire
Partager sur d’autres sites

Bonjour "Madrileño",

Ton étude me rappelle étrangement ce que nous pouvons lire dans ce post [...] et de l'utilisation de la commande "-asdf*(***)...." ou autre.

<{POST_SNAPBACK}>

En fait ce n'est pas pareil l'un permettait de savoir si un site était sandboxer et ici c'est plus pour savoir le nombre de pages entièrement indexés par les moteurs ;)

On remarque bien qu'au début du post l'étude était sur la commande site ou la lettre a tout simplement ;)

Pour les negatifs cela est venu par les échanges et montrent qu'il y a d'autres astuces à tester :D

Lien vers le commentaire
Partager sur d’autres sites

  • 1 month later...

Le retour de la requête "the" ...

Et oui depuis quelques temps on peut voir un retour de la fameuse requete "the" qui affichait le nombre de pages indexés ...

Vous allez être même étonner pour ceux qui ne le savent pas encore ...

=>

Recherche de base en utilisant la toolbar :

http://www.google.fr/search?q=the = 8 650 000 ...

Recherche sur Google Suggest :

http://www.google.com/search?complete=1&hl=en&lr=&q=the = 8 650 000

Recherche sur un des derniers datacenter :

http://64.233.179.104/search?q=the = 23 160 000 000

Vous n'avez pas rêver ...

23 Milliards 160 Millions de pages indexés par Google :lol:

Soit en 1 an le double de ce qu'ils avaient ...

Cela me rapelle l'évolution informatique qui aujourd'hui ne suis plus le modèle de base ( par contre je n'arrive plus à me rapeller qui avait sorti la théorie ... merci d'avance ;) )

Modifié par Madrileño
Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...