|
Publication :
L'Interview du mois
Quels sont les différents critères pris en compte par le célèbre moteur de recherche pour classer les sites Web ? Comprendre pour mieux être référencé. 12 Décembre 2005 Si les algorithmes internes de Google sont secrets et complexes, il est possible de discerner certains comportements, et en les prenant en compte, d'assurer une meilleure visibilité à ses pages Web. Voici quelques exemples. La base fondamentale du fonctionnement de Google est le lien, tant entrant que sortant. À partir du nombre de liens pointant vers un site ou une page, Google peut établir l'importance de la cible, et donc lui accorder une certaine confiance. Plus un site sera lié, plus il sera considéré comme une référence, et sera donc mis en valeur par rapport à d'autres. En analysant le contenu textuel des pages, les ordinateurs de Google tentent d'en extraire la substantifique moelle : des mots-clefs. Ces mots-clefs sont indexés dans une base de données monumentale, parcourue par la requête de l'utilisateur. L'ensemble du texte est trié et classé, sauf les mots trop courants. Cette phase est très importante, montre ici encore l'attachement de Google aux fondations du Web : un site purement textuel aura plus de chance d'être crédible et bien indexé, qu'un site équivalent entièrement réalisé en Flash, ou uniquement disponible en PDF. La relation d'une recherche à une page se fait ensuite non seulement par le poids de la page et les mots-clefs qu'elle contient, mais également par son titre et la manière dont le site est lié. Il est en effet facile de montre que le texte décrivant un lien a sa part dans la recherche : une simple requête contenant "cliquez ici" donnera les pages de téléchargements de certains plugins très liés avec ce descriptif, même si les pages elles-mêmes ne contiennent pas les mots de la requête. De la même manière, si les mots de la requête ou le titre de la page apparaissent dans l'URL - idéalement, séparés par des tirets plutôt qu'avec tous les mots liés, les chances pour cette page d'être bien placée sont plus fortes que si l'URL était d'une forme moins explicite : Enfin, tout comme les sources d'informations de la vie réelle (journaux, magazines...), Google prend en compte la fraîcheur d'une page, et son rythme de mise à jour. Ainsi, un site "vitrine" qui n'a pas changé depuis plusieurs mois aura toujours moins de poids pour Google qu'un site dynamique mis à jour régulièrement. C'est la raison pour laquelle les weblogs peuvent avoir un placement si élevé pour certaines requêtes, face aux sites légitimes mais plus rarement mis à jour des entreprises dont ils discutent. S'ajoutent à cela certaines règles de bon sens, comme par exemple accorder plus de confiance aux noms de domaines déposé pour plusieurs années - car les sites de spam ne sont généralement enregistrés que pour une année -, ou la vitesse à laquelle un site se remplit de liens - si l'ajout est trop rapide, il s'agit probablement d'une ferme à liens, donc d'un spammeur. Ces règles sont changeantes dans leur importance, et de nouvelles peuvent apparaître aussi rapidement qu'elles disparaissent. Le PageRank d'un site, c'est-à-dire son poids dans l'index de Google, dépend donc non seulement de la qualité du contenu d'un site, mais aussi, par extension, de celle des sites qui le lient. Le PageRank correspond donc à un ensemble de vases communicants travaillant avec la crédibilité de chacun, de manière à former un cercle de confiance très large, et aussi éthique que possible. Article de : Xavier Borderie, JDN Développeurs
Initiateur des évolutions XML, XHTML, CSS, SVG et bien d'autres encore, le World Wide Web Consortium régit les technologies du Web. Présentation de son organisation et de ses processus. 21 Juin 2005 Fondé en 1994 par Tim Berners-Lee, le W3C est la culmination du travail de son fondateur dans le cadre de l'accessibilité du réseau par tous. Déjà créateur du premier navigateur et du premier serveur Web, Berners-Lee a mis en place le consortium dans l'objectif d'établir des standards afin de "mener le Web à son plein potentiel" et "assurer sa croissance à long terme". Pour ce faire, le W3C publie de nombreux documents techniques - appelés "Recommandations". Ceux-ci sont rédigés par un représentant de chaque entreprise intéressée dans la création d'une spécification précise, validés par les membres du W3C et ses partenaires pour s'assurer d'une compatibilité entre les différents documents, et publiés dans le domaine public pour que les implémentations voient le jour sur le plus grand nombre de plates-formes possible. Les membres Les membres du W3C sont les entreprises qui participent au développement de documents, mais également les laboratoires de recherche ou même les gouvernements interessés par l'évolution du Web. A l'heure actuelle, il y a plus de 380 membres, parmi lesquels Microsoft, AOL, France Télécom, Sun... Un membre ne peut avoir plus d'un représentant au sein du W3C. Evolution d'un document Le W3C définit 5 étapes de progression/maturation pour un document : 1) Première version de travail (Working Draft) 2) L'annonce de dernier appel (Last Call) 3) La recommandation candidate 4) La recommandation proposée 5) La recommandation Reste que ces documents ne sont pas des standards ou normes à part entière, mais des "ententes". Les spécifications du W3C ne sont en rien des contrats avec obligations légales et attaque en cas de non-respect, simplement le résultat de discussions, de consensus et de mise à plat. Il revient ensuite aux grands acteurs de mettre ces ententes en application, ce qui en fera des standards de fait. Article de : Xavier Borderie, JDN Développeurs |
|
:: MEDIASITES Technopôle du Futuroscope Téléport 1 - Arobase 3 - POITIERS Tél : 05 49 58 96 50 :: |