Aller au contenu

Sebastien

Hubmaster
  • Compteur de contenus

    2 598
  • Inscrit(e) le

  • Dernière visite

Tout ce qui a été posté par Sebastien

  1. Je cherche à faire des études "statistico-linguistiques" sur le texte de certains sites, sur un très grand nombre de pages. Des logiciels comme WinHTTrack permettent de faire une copie locale en HTML, mais ce qui m'interesserai serait un logiciel au fonctionnement équivalent, mais qui sauvegarderait la seule information textuelle, et non le code HTML, idéalement au format .txt. Un tel logiciel (gratuit ou open source) existe-t-il ?
  2. Bah j'ai un Athlon 2500+ et 1 Go de RAM ça devrait convenir non ? Là ça lagge au point que les applis ne répondent plus, alors je me demandais si ça venait des capacités de ces logiciels.
  3. J'essaie de faire des études de la distribution des mots-clés en fonction du nombre de mots les composant, et de la distribution du trafic en fonction des mots-clés histoire d'apprécier l'effet de "longue traine"... Le hic c'est que mes données représentent plus de 36000 lignes, avec 2-3 colonnes voire plus, et Calc rame à mort, et il me semble qu'avec Excel ce ne serait pas mieux. Il faut des outils spécialisés dans ce cas ? Il faut passer par de la programmation ?
  4. Alors, pour le SEO copywriting (Il n'y a pas de terme francophone, je propose "conception-rédaction orientée moteurs"), il s'agit de produire des écrits qui soient à la fois : - Efficaces en termes de visibilité dans les moteurs de recherche. - Efficaces en termes de communication et d'utilisabilité pour les utilisateurs. Au niveau technique il y aurait à détailler, mais cela passe par parler le langage de l'utilisateur (ce qui rejoint le "langage clair et simple" proné en matière d'accessibilité), et par structurer ses contenus (en s'inspirant des recommandations d'accessibilité et des techniques d'écriture journalistique)
  5. Si l'on parle de galaxie de noms de domaines, c'est qu'il y en a beaucoup, ça me fait donc penser à un amas de domaines satellites dans le but de doper artificiellement la popularité. Ou alors il peut s'agir de domaines satellites utilisant des techniques "borderline" mis en place dans l'espoir qu'en cas de blacklistage le véritable site ne soit pas pénalisé. Dans les deux cas je plussoie ce que dit Thick : oublie
  6. Merci tous Thick : on me pose souvent la question, c'est vrai. Je dirai que c'est une question de tempérament, et d'opportunités. Cela dit, rien n'est jamais fixé dans le marbre
  7. Quelques infos sur la confidentialité des données ici : http://www.google.com/support/analytics/bi...&topic=7199 Il n'y a pas plus de danger à utiliser Google qu'à utiliser tout autre prestataire externe. Après si tu travailles sur des projets secrets défense, alors c'est différent
  8. Je pense que les MFA participent globalement à faire baisser la qualité du web : si Google n'était pas aussi laxiste, ces pages n'existeraient pas. Adsense a été crée à la base pour permettre aux éditeurs de monétiser leur contenu. Avec les MFA c'est l'inverse : les éditeurs décident d'afficher de la pub et le contenu est devenu à ce point accessoire (mais indispensable quand même) qu'on le génère automatiquement en agrégeant des sources parfois au mépris de la volonté de leur véritable créateur, en se fichant completement du propos. Je lis par exemple sur le site sus-cité "Un fétiche d'acné n'est aucune matière riante"... PS : enissay, ma critique n'a rien de personnel, c'est plus un ras le bol qu'autre chose, mais je crois sincérement que tu aurais tout à gagner en faisant un travail plus propre et qualitatif.
  9. Je vais paraître sans coeur, mais je trouve tout à fait légitime que Google vire ce genre de site qui ne comporte aucun contenu et n'est fait que pour afficher de la pub. Ce n'est qu'un vulgaire MFA (Made for Adsense) . Si des annonceurs paient des Adwords, ce n'est certainement pas pour ce type d'affichage et je doute qu'aucun utilisateur trouve une utilité à ce type de site
  10. 1. Il s'agit d'une balise disant que ce que tu sers au navigateur est du texte / HTML utilisant le codage de caractère iso-8859-1 (latin) 2. C'est effectivement parce qu'il s'agit du nom de ton site que tu te positionne sur ces termes. Toutes les balises meta ne sont pas liées au référencement. 3. Les balises meta compte pour très peu dans le référencement d'un site, et pour Google on peut considérer que leur importance est quasi nulle, en particulier pour la balise meta keywords. 4. Une balise meta (description) générique est à éviter. Une balise meta spécifique au contenu de chaque page peut éventuellement aider de façon très limitée pour les moteurs en tenant encore compte.
  11. Franchement, je suis désormais étonné de la rapidité d'indexation de Google. J'observe des fois que des nouveaux sites commencent à être indexés quelques jours seulement après soumission aux annuaires. Ceux qui ont quelques années d'expérience en référencement savent le temps que ça pouvait prendre avant
  12. Karnabal : Je veux juste l'ouvrir et le modifier. Le format de sortie sera un pdf ou un format graphique type jpg/png/gif. Nicco : Je ne connais rien aux scripts Python
  13. Connaitriez-vous un logiciel Open Source (ou gratuit) permettant d'éditer des fichiers .ai (Adobe Illustrator). Je croyais que Inkscape en était capable mais ce n'est pas le cas...
  14. Tu as tout à fait raison, ce qui montre bien que l'écriture est un sujet complexe Donc ce que je disais, c'est que pour produire un texte bien conçu pour le référencement, on ferait bien de s'inspirer des techniques pronées par le W3C, ainsi que des techniques d'écriture en langage clair, en insistant juste un peu plus fort sur ses mots-clés (mais sans sacrifier la lisibilité). J'espère avoir été plus clair, sinon j'ai cette synthèse sur le sujet
  15. Le terme "langage naturel" est effectivement insatisfaisant, car en fait il y a plusieurs langages naturels selon le contexte. Cela dit pour le web, suivre les directive d'accessibilité des WCAG et s'efforcer d'écrire en langue simple et claire (plain language), permet avec une emphase sur les mots-clés stratégique de produire des contenus naturellement optimisés pour les utilisateurs et les moteurs. Quand je dis "emphase" j'entend par là insérer les mots clés un tout petit peu plus que ce que l'on écrirait si les moteurs n'existaient pas, sans pour autant produire un texte pénible à lire (bref c'est toujours une question de dosage et d'expérience)
  16. La norme s'établit sur l'ensemble du web, pas sur une thématique. En gros on établit une courbe de distribution de la densité et on définit une fourchette de normalité. En dessous de la fourchette c'est du manque de pertinence, au dessus c'est probablement du spam.
  17. Etre en dessous de la norme c'est ne pas être pertinent. Etre au milieu de la norme c'est être moyen. Etre dans le haut de la norme c'est être éventuellement jugé plus pertinent. Etre au dela de la norme c'est être suspect Je suis à 100% d'accord avec l'interprétation de Cariboo et vous renvoie à cet ancien billet : http://s.billard.free.fr/referencement/ind...e-des-mots-cles
  18. L'amalgame vient du fait que souvent des techniques spammy ont été utilisées non dans l'intention de spammer, mais seulement parce que le site ne pouvait être référencé proprement (sauf refonte complète). Mais c'est vrai Lafleur que le spam peut être pensé en amont
  19. Un levier est la peur du blacklistage. Il ne suffit pas à lui seul à motiver la refonte du site en général, par contre il pousse à intégrer le référencement en amont quand la refonte du site est prévue. L'accessibilité, et c'est bien dommage, la plupart des clients s'en fichent.
  20. Je suis d'accord, sur la majorité des dossiers que je gère, le référencement est pensé après le site Le web est trop souvent vu comme de l'imprimé electronique, alors que c'est un média spécifique.
  21. Tu ne passe pas pour un débile, il faut bien apprendre Concernant les annuaires il faut bien comprendre que ce que l'on référence est le site dans son ensemble. L'indexation est faite par des humains. Il faut décrire simplement le site. Supposons que tu références le site du restaurant "La Moule Joyeuse" à Dunkerque. Le titre serait : "Restaurant la Moule Joyeuse" La description : "La Moule Joyeuse vous accueille à Dunkerque (59-Nord) dans un cadre pittoresque, face à la mer et à deux pas des dunes. Menus et réservation."
  22. Généralement, les annuaires te demandent plusieurs éléments : URL, titre du site, description, mots-clés. Pour gagner du temps, il est donc pertinent de préparer ces éléments à l'avance et de les placer dans un fichier texte qu'on utilisera pour faire des copié-collé
  23. Oui, inscrire à la main son site dans les annuaires généralistes et spécialisés prend du temps. Tu peux y passer une journée complète, voir plus.
×
×
  • Créer...