Mort au Duplicate Content !


Mort au Duplicate Content !

Cette fois… c’en est trop !

Duplicate Content, le vicieux, l’infâme… a dépassé les bornes des limites (comme Maurice).

Dorénavant, tout site dont la description s’avère trop proche d’une description précédemment soumise à d’autres annuaires, publiée sur un site tiers, ou serait constituée de contenu copié-collé du site à référencer verra son indexation dans l’annuaire indeXweb.info refusée.

Nous avons mis en place un filtre nous permettant de déceler tout contenu dupliqué qui ne laissera plus de place à la duplication de contenu, véritable fléau du positionnement.

Autant pour la qualité de votre référencement que pour l’efficacité de l’annuaire indeXweb.info, il est impératif que vous proposiez un contenu unique, rédigé à la troisième personne (pas de “je”, “nous”, etc…), correctement orthographié et sémantiquement correct. Ne fourrez pas la description de mots-clés redondants: utilisez les synonymes et tournez vos phrases avec un minimum d’élégance (…que Diable !).

En marge du filtre zero-duplicate qui a été implémenté, une liste spéciale de sites marqués comme “risqués” en la matière est en cours de constitution: j’envisage de la partager à terme avec certains gestionnaires d’annuaires sérieux, afin de lutter ensemble contre la problématique majeure que représente aujourd’hui le duplicate content et pour laquelle les responsables désignés sont -à tort !- les annuairistes… les vrais responsables étant les webmasters et référenceurs manquant cruellement de professionalisme.

Bon Ref’Nat !

A lire également:

  • QualiSEO: une liste de 500 annuaires ! (2)
  • Yooda Submit: créons des liens ! (7)
  • 400 annuaires pour votre référencement (6)
  • Indexation express ? (1)
  • Mon annuaire d'annuaires: qualiSEO ! (14)
  • Référencez votre annuaire ! (5)
  • 30000 sites dans l'index (5)
  • Référencement de flux RSS (1)
  • Hébergeurs gratuits, spamdexing et MFA (6)
  • Annuaire recherche éditeurs (5)
  • Top Sponsors: Janvier 2008 (1)
  • Jérôme Kerviel est dans l'annuaire ! (0)



  • Ajouter  Google Reader S'abonner via Mon Yahoo Ajouter  Netvibes Ajouter ce site sur Bookmarks.fr S'abonner via Bloglines

    15 commentaires »

    1. dd32 a écrit,

      29 septembre, 2008 @ 18:24

      Bien dit Maurice !
      Et ne pousse pas le Duplicate trop loin :D

    2. JanoLapin a écrit,

      29 septembre, 2008 @ 19:19

      d’où l’intérêt de privilégier des annauires qui ont une zone membre, ce qui permet de venir faire des mises à jours u des modifs..

      un futur critère pour Qualiseo ?

      PS que diantre !

    3. e comme erco a écrit,

      29 septembre, 2008 @ 20:21

      Voilà un article qui a le goût de moutarde :-))
      Nous voici donc avec une vraie déclaration de guerre … ça couvait !
      Depuis que le temps que la toile laissait moisir ça et là des notes de « les annuaires et leurs copié-collé »
      Tiens et bien ton éternuement me va à ravir.
      (Avec une curiosité à peine masquée de voir comment l’outil est conçu…)

    4. JanoLapin a écrit,

      29 septembre, 2008 @ 21:39

      … autant repasser dans tous les annuaires de qualité ou l’on s’est inscrit pour tâcher de “personnaliser” ce qu’n y a déjà laissé.. on y gagne ainsi deux fois !

      Avec une vraie question qui se pose: à partir de quand il y a-t-il duplicate content? Des “similitudes” (aussi lâches qu’en soit la définition)restent inévitables, non ? Ne serait que “sémantiqueùment”: la liste des synonymes est restreinte, et d’autant plus que l’on référence un objet professionnel, cad spécialisé et non générique.

    5. Leon du 69 a écrit,

      30 septembre, 2008 @ 8:25

      Alors, que penser de indexweb.info?

      J’ai réalisé avec horreur que:
      1. indexweb.info genere du duplicate content via mon flux RSS
      2. indexweb.info sort devant moi sur certains mots-clefs… grace à mon contenu

      J’ai reagi en edulcorant mes flux RSS en direction de indexweb.info… mais je suis curieux de connaitre la position de indexweb.info sur le duplicate content lié… à indexweb.info ?

    6. parparela a écrit,

      30 septembre, 2008 @ 15:23

      Assez d’accord, mais il faut pas pousser le filtre trop loin quand même on peut pas inventer une nouvelle description totalement différente d’un annuaire à un autre.

    7. Kilroy a écrit,

      30 septembre, 2008 @ 21:58

      Indexweb est indéniablement un cran au dessus de la plupart des autres annuaires au niveau qualité, on peut donc comprendre cette exigence. Quand on voit ce que font d’autres annuaires on se dit que c’est parfaitement légitime. Par contre, je pense qu’il y a moins de soucis de duplicate content (ou alors seulement sur des portions de texte) car les descriptions demandées sont nettement plus longues que sur la plupart des annuaires (qui les limitent à 255 caractères). Cela force les webmasters à compléter les descriptions soumises ailleurs.

      Maintenant je veux bien pousser le souci de qualité assez loin, mais je ne pense pas que les webmasters vont faire une description de 250 caractères différente pour chaque annuaire sur lequel ils soumettent leur site.

      Enfin, dernière remarque, les descriptions “sans duplicate” ont surtout un intérêt pour l’efficacité d’Indexweb à drainer du trafic… parfois aux dépends des sites inscrits. En effet, peu après leur validation, les fiches individuelles se positionnent parfois avant les sites qu’elles mentionnent, surtout si ces derniers sont récents ou ont peu de liens entrants. Les choses rentrent généralement dans l’ordre au bout de quelques jours mais au début ça surprend.

    8. HawkEye a écrit,

      30 septembre, 2008 @ 22:54

      @Kilroy: effectivement, on ne peut pas se permettre d’exiger une description unique pour chaque annuaire. indeXweb.info impose une description au moins plus longue que la taille maximale des scripts “classiques”: le but est évidemment avoué ;)

      Il est vrai que l’annuaire a tendance à se positionner très très haut sur certains contenus frais, parfois au détriment du site client, mais comme tu le fais remarquer, il “traîne” le client vers le haut, après quelques jours. Le problème se pose avec tous les sites ayant un peu de potentiel.

      @Leon du 69: Oui - et non.
      Le contenu fourni à News.indeXweb.info est systématiquement tronqué pour éviter précisément d’entrer en concurrence avec les flux qu’il agrège, car il n’est pas dans notre intérêt de nuire à notre clientèle: ce serait scier la branche qui nous supporte.
      Néanmoins, il est évident que les billets “courts” (ie: 128 caractères) ne seront pas plus “tronqués” qu’ils ne sont déjà trop courts: ceux-là souffrent évidemment un peu du système.
      A noter que je sélectionne tout de même les sources avec de plus en plus de rigueur, et que je n’intègre à l’agrégateur que de moins en moins de flux, et uniquement ceux qui me semblent intéressants et “riches”.
      Je suis de ceux qui pensent qu’à lier vers un mauvais site, on se nuit à soi-même. Ayant repassé tous les liens de l’agrégateur en dur, il va de soi que je veille à mon voisinage :)
      Une autre solution, évidemment, serait de rédiger des billets un peu plus longs que “mate c’te vidéo: [youtube az215ae13]” (mais on va encore me dire que je demande au webmaster de faire mon boulot :))

      @Janolapin: pour moi, la limite (dans ce cadre ci, de validations dans un annuaire), c’est lorsque je vérifie sur Google et que je me rends compte que des centaines d’autres annuaires présentent le même contenu: à ce moment là, je ne vois pas ce que le mien apporterait de plus ;)

    9. Leon du 69 a écrit,

      1 octobre, 2008 @ 8:50

      @Kilroy: “dernière remarque, les descriptions “sans duplicate” ont surtout un intérêt pour l’efficacité d’Indexweb à drainer du trafic”
      Entierement d’accord. Dire le contraire serait du marketing de caniveau.

      Après, tout est question d’équilibre. Depuis que j’ai soumis mon site et son flux (aux débuts de indexweb), j’ai déchanté: j’ai pas l’impression d’être _actuellement_ dans un deal gagnant/gagnant. Mais je crois encore au potentiel de indexweb.info pour les webmasters, puisque je suis ici…

      @HawkEye: Je viens de regarder: mes “articles” font entre 200 et 1000 caractères, mais le flux RSS ne reprends que la première partie (pour limiter les duplicates…), et du coup, il arrive en effet que cela fasse moins de 180 caractères (90 à 300).

      J’en arrive à envisager ” d’apauvrir ” mes flux RSS en diluant le contenu pertinent (ce sera toujours moins violent que ce que j’ai fait aujourd’hui: remplacé le contenu par un lien vers l’article).

      Je n’ai rien contre indexweb.info, ni le fait qu’il draine du trafic via mon contenu (unique)… tant que j’en tire egalement un benefice substanciel (c’est la raison de ma soumission, hein…).

      a suivre…

    10. HawkEye a écrit,

      2 octobre, 2008 @ 0:00

      Petite précision tout de même: l’agrégateur n’existe que depuis 3 mois… les débuts d’indeXweb.info c’était il y a 3 ans, et l’annuaire n’a jamais permis l’agrégation de flux ;)

      “News” est précisément né de la réflexion suivante: faut-il greffer des fonctionnalités “RSS” à l’annuaire existant (comme le font les scripts récents par défaut), ou non ?
      Je me suis dit qu’il ne fallait pas que ces services soient mêlés (ça finirait en poubelle…), et qu’un outil axé “actu” serait plus sympa.
      J’essaye de m’en tenir donc aux flux d’actualités (même si certains sites de recettes par exemple sont assez sympa à agréger, et d’autres également), et de respecter un équilibre qui fasse qu’on reste “win-win” (c’est pas facile).

      Comme je l’ai déjà expliqué (sur WRI je crois), j’ai fini par me fixer sur des liens en dur, pour apporter une notion “boost SEO” à l’outil, mais j’ai tout de même essayé la redir bloquée (robots.txt), et le nofollow, avant de revenir à du lien dur… parce que pour moi, cet outil doit avant tout être générateur de trafic.

      Il n’y a aucun secret: News.indeXweb.info fait entre 12.000 et 15.000 VU quotidiens. Sans révéler de chiffres exacts, je peux tout du moins affirmer que “l’emprise publicitaire” est bien au dessous des 5%. Les 95+% qui restent partent en conversion vers le site client, en dilution dans le site, ou en rebond (svp: regardez le bounce rate de votre site, et dites-vous que “News.idX” doit avoir à peu près le même sur l’extrait de vos billets: si vous perdez 60% de vos visiteurs en rebond, pensez bien que nous aussi !).

      Pour finir, je voudrais préciser que News.idX va prochainement se doter d’un outil assez sympa, qui devrait s’avérer intéressant pour tous, à nouveau autant d’un point de vue “VU” que d’un point de vue purement SEO. J’y reviendrai prochainement ;)

    11. mehdi a écrit,

      4 octobre, 2008 @ 0:43

      google devient très stricte sur le duplicate, vraiment très stricte et je pense que c’est un peut trop, pour les sites qui ne maitrisent pas ou peu leur contenu l’affaire est très difficile, exemple pour un site d’annonces les annonces se ressemblent entre elles en interne du site et avec d’autres sites, meme avec une phrase en commun entre deux page peut causer la désindexation, un site partageant une phrase en commun dans toutes ses pages telque “Le contenu des petites annonces est fourni par leurs éditeurs … etc ..” va souffrir de cet algo trop serré, j’ai vraiment fait un effort pour s’adapter avec ses changement, pour les petits sites (et les annuaires par exemple) la tache n’est pas facile, indexweb a su comment s’ensortir et je suis d’accord que ce sont les webmaster qui doivent fournir du contenu original aux annuaires qui leurs référencent.

    12. seccus a écrit,

      13 octobre, 2008 @ 23:09

      Je comprends le pourquoi de la démarche et j’appuie par exprit d’équité envers tous les (futurs:un souhait) membres d’Indexweb. Toutefois, cela fait rire cette paranoïa avec le DC. J’ai inscrit un site sur plus de 500 annuaires, d’Indexweb et d’ailleurs avec le même titre, le même résumé et les mêmes tags. Si j’ai bien compris, les moteurs de recherche et cie vont me pénaliser pour ce DC? Pour stimuler le débat, je vous invite à lire le billet de bababillgates : http://bababillgates.free.fr/index.php/le-duplicate-content-ce-nest-pas-du-tout-ce-que-vous-croyez/….

    13. HawkEye a écrit,

      15 octobre, 2008 @ 18:32

      Ce n’est pas toi qui es pénalisé, seccus: ce sont les 500 annuaires qui ont accepté ce contenu qui se dévalorise à chaque occurence, ce qui -à terme- fait que les liens que te fournissent ces annuaires perdent de leur intérêt, et au final, rendent ton travail de référencement inefficace.

    14. elkiem a écrit,

      18 octobre, 2008 @ 4:23

      Ne pas faire de DC je veux bien mais je trouve pas vraiment de moyen de faire un description différente dans 1000 annuaires avec le sujet de mon site. De toute façon c’est impossible de faire une tone de description différente pour un sujet comme celui de mon site non?
      http://hebergement-web-canadien.ca

    15. HawkEye a écrit,

      20 octobre, 2008 @ 16:33

      @elkiem: effectivement il est impossible de rédiger 1000 descriptions différentes. Sans vouloir faire de ségrégation, il faut tout de même avouer qu’il existe deux groupes d’annuaires bien distincts: les gros, et les petits.
      Je ne voudrais pas dire qu’on peut refiler le duplicate au petit, mais il me semble (même si mon avis est biaisé), qu’on peut se donner la peine d’offrir aux plus gros (je parle en termes d’audience et de potentiel) un contenu un peu plus étudié, puisque ce sont ces annuaires qui sont les plus à même de transmettre une part de leur potentiel, et de renvoyer quelques visiteurs vers ton site.

      NB: je pars du postulat évident qu’il n’y a pas 1000 “gros” annuaires francophones :)

    Flux RSS des commentaires · URI de Trackback

    Ajouter un commentaire