Aller au contenu

rss dans une base de donnée


deuletor

Sujets conseillés

bonjour,

voila j'ai un partenaire qui ecrit des news et permet sont utilisation par rss.

donc rien d'illégal.

j'aimerais les recupére pour les ajouter dans une base de donnée mais comment faire ?

je commence un peu a me debrouiller en php mais je suis pas un pro donc si quelqu'un peu m'aide merci.

Lien vers le commentaire
Partager sur d’autres sites

Si tu touches un peu en PHP et que tu utilises la version 5, je te conseille simplement de lire la documentation du module SimpleXML.

C'est de loin le moyen le plus simple et le plus puissant pour exploiter un flux RSS !

Si tu utilises PHP4, il te faudra trouver un parseur XML, mais je n'ai pas de nom en tête, il faudra chercher ;)

Lien vers le commentaire
Partager sur d’autres sites

:) ha sa fait toujours plaisir de voir l'enthousiasme des personnes qui nous répondre sur ce forum !!! merci.

Oui magpierss je connais vaguement mais pour vous quel est le meilleur agrégateur je cherche au plus simple .

Je vois comment faire avec l'agrégateur je récupérais les news dans ma base en vérifiant une des entrées titre ou date si elle n'existe pas.

Pour éviter une surcharge j'utiliserais les dates pour suprimer les dernier news .

Et pour éviter trop de connections a ma base je lancerais mon script a heure fixe avec un crom.

voila c'est une méthode un peu barbare :whistling: et il doit avoir plus simple mais comme j'ai dit plus haut je suis pas un pro :smartass: .

si vous avez une autre solution .....

Lien vers le commentaire
Partager sur d’autres sites

Bonjour,

Pourquoi supprimer les News ? Même anciennes, elles peuvent être utiles pour

1. Le contenu et les visiteurs de ton site

2. Ton référencement => plus de pages, plus de contenu, plus de choses à se mettre sous la dent, plus de mots-clefs...

Bref, ça serait tout bénef de les laisser !

Ca me dérange pas de garder quelques Mo de données dans ma base, moi :P tant que c'est du contenu utile...

Mais tu n'es pas obligé de stocker les données en plus ? Le RSS sert justement à recevoir les données d'un autre site... Par exemple dans la partie actualité de mon site, j'ai directement les RSS provenant du Nouvel Obs, rien de stocké dans ma base...

Lien vers le commentaire
Partager sur d’autres sites

Je réfléchis aussi de mon côté à la solution que je vais employer :rolleyes:

Disons qu'ici c'est un peu différent, j'analyse plusieurs flux RSS et j'extrais les news relatives à un domaine en particulier pour en afficher les plus pertinents. La procédure prend plus de temps surtout s'il y a plusieurs flux à analyser, si je veux classer par pertinence, supprimer les doublons, calculer l'indice de pertinence, ...

J'hésite entre plusieurs solutions :

- mettre un javascript qui permettrait l'affichage des news tout en permettant l'affichage de la page dans un premier temps ... ici l'opération serait recommencée à chaque accès de la page :blush:

- effectuer les opérations de sélection dans une table "tampon" ou dans le script PHP et stocker le résultat dans la base de donnéesn, avec réactualisation régulière des informations

P.S. Je n'ai pas eu de difficulté avec ATOM même si je ne suis pas trop familier du XML ou de l'intégration de scripts externes. J'ai essayé avec d'autres mais ça ne fonctionnait pas ou alors ils n'étaient pas à jour par rapport à la version des flux RSS. ;)

Lien vers le commentaire
Partager sur d’autres sites

Effectivement, si tu veux faire un tri plus précis parmi les infos RSS, tu peux penser à stocker dans une bdd... Même si je te conseille de ne pas supprimer après coup, ça rajoute du contenu sous forme d'"archives"...

Par contre, difficile de trier en temps réel les derniers RSS parus, sans qu'il y ait une intervention manuelle. Les doublons sont pas forcément visibles par la technologie (deux articles sur un même thême X ne traitent pas forcément ce thème sous le même regard).

Lien vers le commentaire
Partager sur d’autres sites

non sarc je suis d'accord avec toi pour le fait que le traitement manuel est supérieur à une opération automatique ;)

Cependant, je ne vais pas traiter l'info de manière exhaustive ... et je n'ai pas le temps de traiter plusieurs centaines d'extraits chaque jour non plus :blush:

D'où mon idée.

En ce qui concerne le stockage dans la base de données ... je me pose l'une ou l'autre question en rapport avec les droits d'auteur (suite à ce qui s'est passé avec Google). Je ne tiens pas à m'approprier le contenu des autres mais à présenter une rubrique qui peut être utile pour mes visiteurs, d'autant plus que les flux RSS présentent des contenus qui apparaissent et disparaissent très vite ! :whistling:

Je m'écarte un peu du sujet initial mais je pense que c'est une question importante aussi quand on se lance :P

Lien vers le commentaire
Partager sur d’autres sites

oui c'est vrai que je pourrais les garder et reprendre seulement le lien avec la date .

c'est referencer le rss ?

Mais me viens cet question

Peut on reprendre des news d'un site pour d'ajouter dans une base sans demander l'autorisation car dans se cas la il serait facile de reprendre les plus grands hebdo de france et du monde et de se faire une mega-base :blush: .

Pas mal ton site sarc :thumbsup: c'est un peu dans cet état d'esprit que je cherche à faire.

sarc comment tu fais pour l'enregistrement dans ta base tu utilise un crom ou c'est une vérification a chaque affichage de page ou autre ?

Modifié par deuletor
Lien vers le commentaire
Partager sur d’autres sites

finalement non je pourrais pas faire comme j'ai dit garder seulement l'url du flux car je veux y rajouter un moteur de recherche a moin qu'il crawl mes page mais la encore si je recois 30 news par jour le moteur de recherche va pas suivre .

Lien vers le commentaire
Partager sur d’autres sites

Veuillez vous connecter pour commenter

Vous pourrez laisser un commentaire après vous êtes connecté.



Connectez-vous maintenant
×
×
  • Créer...