Version complète: sur le forum Webmaster Hub : Google actualités
Webmaster Hub > Accueil > Le salon de Webmaster Hub
michaeljack
Bonjour à tous !

J'ai effectué il y a quelques temps une demande à Google actualités qui avait été accepté sur cette url : http://www.mjackson.fr/index.php?showforum=161

Ne voyant toujours aucune news reprise de mon site par google actu sur Michael, je les contacte et voici leur réponse:

CITATION
Bonjour,

Merci de votre message. Après investigation, nous avons constaté que notre
système ne pouvait pas explorer vos articles car ils sont configurés comme
des messages ou des fils de forum de discussion.

Comme vous le savez peut-être, Google Actualités est compilé uniquement
par des algorithmes informatiques et les articles sont collectés à l'issue
d'une analyse automatique des sites Web d'information. Pour analyser
correctement les articles, les sources d'information exploitées par Google
Actualités doivent être configurées au format HTML standard.

Si vous pouvez apporter les modifications à votre site (ou à une section
de votre site présentant des articles d'information), nous serions heureux
de le réexaminer afin de l'intégrer. Vous trouverez ci-après quelques
conseils techniques qui aideront notre robot d'exploration à trouver et
indexer correctement les articles figurant sur votre site :

1. Pour que notre robot-explorateur extraie correctement les articles,
votre site doit être en HTML standard.

2. Chaque page contenant le texte complet d'un article doit posséder une
URL distincte qui demeure inchangée. Nous ne pouvons pas ajouter sur
Google Actualités de sites présentant plusieurs articles sur une même URL.


3. De plus, l'URL de chaque article doit contenir un numéro unique
comportant au moins trois chiffres.

Notre robot-explorateur ne pourrait pas, par exemple, analyser les URLs
suivantes :
www.google.fr/rongeurs_dans_la_brume.html
www.google.fr/infos/article23.html

En revanche, il pourra analyser les URLs suivantes :
www.google.fr/infos/08112003/article.html
www.google.fr/infos/rongeurs_dans_la_brume/23467.html

4. Notez également que nous ne pouvons pas ajouter de sites dont les URL
contiennent une date. Les URLs contenant des dates changent souvent tous
les jours ou toutes les semaines. Ces changements réguliers nous empêchent
de détecter les modifications apportées au contenu, car nous ne pouvons
pas déterminer l'URL la plus récente à analyser.

5. notre robot-explorateur est actuellement optimisé pour analyser les
liens HTML classiques. Nous ne pouvons pas explorer les liens graphiques
ni les liens intégrés dans des scripts Javascript.

Exemple de site que nous pouvons analyser : http://english.chosun.com.
Notez que tous les articles de ce site sont associés à des URLs distinctes
qui restent inchangées.

Nous apprécions votre aide dans le cadre de notre processus d'amélioration
de Google Actualités. N'hésitez pas à nous contacter si vous avez d'autres
questions.

Cordialement,
L'équipe Google



1/ Pourquoi avoir préalablement accepté mon lien puis ensuite me dire qu'il n'est pas valable?
2/ Un flux rss pourrait convenir? Si non, quelqu'un a une idée de ce que je dois faire?

Je vous remercie d'avance.
Arlette
Bonjour,

Réponse à la question 1 : Certainement parce que c'est un robot qui t'a répondu.

Réponse à la question 2 : Si tu avais lu les notes à l'attention des éditeurs tu aurais avant même de soumettre, lu tout ce que Google t'a répondu. Et en autre la réponse à ta question pour les flux RSS :
CITATION
Google Actualités recueille les articles en explorant d'autres sites d'information. Veuillez noter que nous ne sommes pas en mesure d'accepter des articles qui nous sont envoyés par courrier électronique ni d'explorer les flux RSS ou Atom


Source : Règles pour les éditeurs
michaeljack
Je sais bien Arlette, mais j'ai bien précisé qu'ils avaient au préalable accepter le lien tel quel....
D'où mon incompréhension....
Arlette
CITATION(michaeljack @ mardi 15 mai 2007, 19h45) *
Je sais bien Arlette, mais j'ai bien précisé qu'ils avaient au préalable accepter le lien tel quel....

Oui, mais c'est ce que je t'ai donc répondu à ta question 1 : C'est un robot qui t'a répondu. Donc on accepte tout, partant du principe que tu soumets après avoir lu les règles à l'attention des éditeurs... Et après le robot ne peut pas aller plus loin. Et quand tu demandes le pourquoi du comment on te répond ce qui est inscrit dans les règles. CQFD.

Visiblement tu ne les avais pas lu, puisque tu demandes pour les flux RSS alors que c'est bien stipulé wink.gif
Anonymus
Autrement dit, ils acceptent ton site, mais se réservent le droit de l'afficher.
et en l'occurence, ils ne l'affichent pas smile.gif

[après visite sur ton site]
De plus, dans les urls de ton forum, tu as les id de session :
s=b01ead182b9beff5799bfb053c37e34b&showtopic=10105
Une actualité se présente sous plusieurs urls, et c'est spécifié dans le point 2 mentionné dans leur mail : un article <> une url.
pour ton site, ce n'est pas le cas.
michaeljack
Merci pour vos réponses. Pouvez-vous me donner une technique, que vous voyez la plus simple, pour automatiser ces news au format HTML?

Merci
Ceci est une version "bas débit" de notre forum. Pour voir la version complète avec plus d'information, la mise en page et les images, veuillez cliquer ici.