8 juin, 2006 at 15:00
· Dans la catégorie Référencement
Se positionner dans les premiers résultats de Google fut un temps relativement simple. Tout ce qu’il fallait c’était beaucoup de liens, une pointe d’optimisation de vos pages, et en peu de temps vous voyiez votre site grimper dans les résultats. Néanmoins, après une belle série de mises-à-jour, beaucoup de spéculations de la part des “experts”, et ce qui semble être des modifications majeures de l’algorithme de Google, bien se positionner semble être devenu beaucoup plus complexe…
Lire la suite »
17 mai, 2006 at 14:30
· Dans la catégorie Référencement
Dans un long billet, Matt Cutts revient sur la mise en place de Bigdaddy, la désindexation de certains sites, et fournit des éléments laissant à penser qu’une stratégie de liens trop fortement basée sur l’achat de liens ou l’échange de liens réciproques peut être nuisible.
Sur Bigdaddy : Cette mise à jour logicielle de de l’algorithme a concerné essentiellement la partie du moteur dédiée au crawling, et dans une moindre mesure, celle dédiée à l’indexation. Débuté en décembre 2005, le déploiement de Bigdaddy s’est achevé fin mars.
De nombreux webmasters ont signalé au début de Bigdaddy la désindexation d’une partie de leur site. Après examen, il s’est avéré que les sites désindexés affichaient en général des liens de qualité douteuse, comme des liens réciproques trop systématiques, ou des liens vers des réseaux identifiés comme étant du spam. En conséquence, la tolérance de l’algorithme a été revue à la hausse, afin d’indexer plus de pages de ce type.
Certains sites continuent cependant d’afficher un nombre réduit de pages indexées. Matt Cutts donne quelques pistes pour expliquer ce phénomène : “Je m’intéresserais en priorité à la qualité de mes liens si je voulais voir plus de pages crawlées. Depuis cet update, nous avons amélioré la façon dont nous traitons les liens réciproques et l’achat de liens (…) Si vous étiez crawlé plus fréquemment avant l’update, et que vous échangez beaucoup de liens réciproques, ne soyez pas surpris si le nouveau robot a désormais d’autres priorités et vient moins fréquemment (…) Il est probable que des webmasters très actifs dans l’échange de liens se voient moins crawlés (…) Si vous avez un site qui ne fait que de l’affiliation, il serait bon de penser à la valeur ajoutée que votre site apporte à l’utilisateur”.
Transcrit avec l’autorisation expresse de Sébastien Billard (Bigdaddy et stratégie de liens)
20 avril, 2006 at 11:00
· Dans la catégorie Référencement, Google AdSense
Des résultats en provenance de MediaBot (AdSense Mediapartners bot) utilisées par Big Daddy…
Matt Cutts a confirmé dernièrement que le robot Mediapartners de Google AdSense indexe des pages et les fournit à l’index de Big Daddy.
On retrouve des preuves que le passage du robot d’AdSense Mediapartners (à des fins de ciblage des publicités contextuelles Google AdSense) se retrouvent dans les résultats de recherche de Google.

Matt Cutts confirme ces rumeurs à propos de résultats glanés par Mediabot qui se retrouvent dans Big Daddy. Matt Cutts indique qu’il s’agit d’un moyen de préservation de bande passante qui fait que GoogleBot et MediaBot contribuent tous deux à l’index de Big Daddy.
Matt Cutts indique qu’il n’y a rien à y gagner d’un point de vue positionnement. Le fait qu’un contenu ait été indexé par GoogleBot ou par MediaBot ne changerait rien en termes de positionnement dans l’index. Néanmoins, il indique aussi que cela pourrait servir de méthode de détection de pages masquées (cloaking) à l’un des deux robots.
Force est de constater qu’il existe une faille, en ce sens qu’un contenu qui serait interdit à l’indexation par GoogleBot (via robots.txt) pourrait néanmoins être indexé par MediaBot.
Source: JenSense (anglais)
Addendum: Après vérification, les conditions d’utilisation du programme Google AdSense stipulent à l’article 16. que Google s’autorise à indexer et à mettre les pages en cache:
“En outre, vous autorisez Google à accéder au(x) Site(s), à indexer et à mettre en cache tout ou partie du(des) Site(s), y compris par des moyens automatiques tels que des robots d’indexation (« spiders ») ou d’exploration (« crawlers ») Web.”