J'ai effectué il y a quelques temps une demande à Google actualités qui avait été accepté sur cette url : http://www.mjackson.fr/index.php?showforum=161
Ne voyant toujours aucune news reprise de mon site par google actu sur Michael, je les contacte et voici leur réponse:
CITATION
Bonjour,
Merci de votre message. Après investigation, nous avons constaté que notre
système ne pouvait pas explorer vos articles car ils sont configurés comme
des messages ou des fils de forum de discussion.
Comme vous le savez peut-être, Google Actualités est compilé uniquement
par des algorithmes informatiques et les articles sont collectés à l'issue
d'une analyse automatique des sites Web d'information. Pour analyser
correctement les articles, les sources d'information exploitées par Google
Actualités doivent être configurées au format HTML standard.
Si vous pouvez apporter les modifications à votre site (ou à une section
de votre site présentant des articles d'information), nous serions heureux
de le réexaminer afin de l'intégrer. Vous trouverez ci-après quelques
conseils techniques qui aideront notre robot d'exploration à trouver et
indexer correctement les articles figurant sur votre site :
1. Pour que notre robot-explorateur extraie correctement les articles,
votre site doit être en HTML standard.
2. Chaque page contenant le texte complet d'un article doit posséder une
URL distincte qui demeure inchangée. Nous ne pouvons pas ajouter sur
Google Actualités de sites présentant plusieurs articles sur une même URL.
3. De plus, l'URL de chaque article doit contenir un numéro unique
comportant au moins trois chiffres.
Notre robot-explorateur ne pourrait pas, par exemple, analyser les URLs
suivantes :
www.google.fr/rongeurs_dans_la_brume.html
www.google.fr/infos/article23.html
En revanche, il pourra analyser les URLs suivantes :
www.google.fr/infos/08112003/article.html
www.google.fr/infos/rongeurs_dans_la_brume/23467.html
4. Notez également que nous ne pouvons pas ajouter de sites dont les URL
contiennent une date. Les URLs contenant des dates changent souvent tous
les jours ou toutes les semaines. Ces changements réguliers nous empêchent
de détecter les modifications apportées au contenu, car nous ne pouvons
pas déterminer l'URL la plus récente à analyser.
5. notre robot-explorateur est actuellement optimisé pour analyser les
liens HTML classiques. Nous ne pouvons pas explorer les liens graphiques
ni les liens intégrés dans des scripts Javascript.
Exemple de site que nous pouvons analyser : http://english.chosun.com.
Notez que tous les articles de ce site sont associés à des URLs distinctes
qui restent inchangées.
Nous apprécions votre aide dans le cadre de notre processus d'amélioration
de Google Actualités. N'hésitez pas à nous contacter si vous avez d'autres
questions.
Cordialement,
L'équipe Google
Merci de votre message. Après investigation, nous avons constaté que notre
système ne pouvait pas explorer vos articles car ils sont configurés comme
des messages ou des fils de forum de discussion.
Comme vous le savez peut-être, Google Actualités est compilé uniquement
par des algorithmes informatiques et les articles sont collectés à l'issue
d'une analyse automatique des sites Web d'information. Pour analyser
correctement les articles, les sources d'information exploitées par Google
Actualités doivent être configurées au format HTML standard.
Si vous pouvez apporter les modifications à votre site (ou à une section
de votre site présentant des articles d'information), nous serions heureux
de le réexaminer afin de l'intégrer. Vous trouverez ci-après quelques
conseils techniques qui aideront notre robot d'exploration à trouver et
indexer correctement les articles figurant sur votre site :
1. Pour que notre robot-explorateur extraie correctement les articles,
votre site doit être en HTML standard.
2. Chaque page contenant le texte complet d'un article doit posséder une
URL distincte qui demeure inchangée. Nous ne pouvons pas ajouter sur
Google Actualités de sites présentant plusieurs articles sur une même URL.
3. De plus, l'URL de chaque article doit contenir un numéro unique
comportant au moins trois chiffres.
Notre robot-explorateur ne pourrait pas, par exemple, analyser les URLs
suivantes :
www.google.fr/rongeurs_dans_la_brume.html
www.google.fr/infos/article23.html
En revanche, il pourra analyser les URLs suivantes :
www.google.fr/infos/08112003/article.html
www.google.fr/infos/rongeurs_dans_la_brume/23467.html
4. Notez également que nous ne pouvons pas ajouter de sites dont les URL
contiennent une date. Les URLs contenant des dates changent souvent tous
les jours ou toutes les semaines. Ces changements réguliers nous empêchent
de détecter les modifications apportées au contenu, car nous ne pouvons
pas déterminer l'URL la plus récente à analyser.
5. notre robot-explorateur est actuellement optimisé pour analyser les
liens HTML classiques. Nous ne pouvons pas explorer les liens graphiques
ni les liens intégrés dans des scripts Javascript.
Exemple de site que nous pouvons analyser : http://english.chosun.com.
Notez que tous les articles de ce site sont associés à des URLs distinctes
qui restent inchangées.
Nous apprécions votre aide dans le cadre de notre processus d'amélioration
de Google Actualités. N'hésitez pas à nous contacter si vous avez d'autres
questions.
Cordialement,
L'équipe Google
1/ Pourquoi avoir préalablement accepté mon lien puis ensuite me dire qu'il n'est pas valable?
2/ Un flux rss pourrait convenir? Si non, quelqu'un a une idée de ce que je dois faire?
Je vous remercie d'avance.
