Big Brother : L’Europe s’inquiète de l’hégémonie de Google

Google, nouveau Big Brother ?

 C’est en tout cas la question que se pose le « groupe de travail de l’Article 29″ (» Article 29 Working Party» ), chargé au sein de la Commission européenne de coordonner la protection des données privées en Europe, « la protection des données et leur libre circulation» .

Ce groupe de travail a demandé au moteur de recherche, au travers d’un courrier envoyé il y a peu, d’en dire plus et d’expliquer son fonctionnement et son mode de stockage des données privées afin de savoir, dans un deuxième temps, si ces pratiques ne mettent pas en danger les internautes européens et ce qui déterminera l’ouverture ou non d’une éventuelle enquête…

Source: http://actu.abondance.com/2007-22/article-29.php

 Widepress, nouveau moteur d’actualités

Synthesio, la jeune société francaise de recherche d’information, vient de lancer WidePress un moteur de recherche d’actualités. Basé sur la technologie Synthesio, qui annonce plus de 40 000 sources indexées dans 85 pays, WidePress s’attaque à la recherche d’actualités, un secteur dominé par Google News, que Wikio n’a pas réussi à ébranler.

WidePress annoncait, quelques jours avant sa sortie, indexer 6 776 216 articles sur 35 472 sources avec 450 jours d’archives. Avec une recherche en 5 langues et une catégorisation simple et pratique, le moteur de recherche d’actualités WidePress a des cartes à jouer, avec un le raffinement de recherche assez pratique par thèmes, par sources, et par pays.

Source : www.malaiac.net

 Visualisez les pubs Google Adsense en fonction de mots-clés ou d’une URL

Google adsense

Pour ceux qui hésitent à placer des Google Adsense dans leurs pages et qui voudraient avoir une idée avant de ce que cela peut donner, voilà Adsense Sandbox, un petit outil pratique qui vous permet de voir directement quelles publicités Google Adsense sur tels mots-clés, mais surtout sur tel site, en saisissant tout simplement son URL

Source : Download Squad

 Google Searchology Day : la vision de Google

Cet évènement a pour objectif de présenter la vision et les nouvelles orientations de Google en tant que futur moteur de recherche.

Cette journée a été l’occasion pour Google de présenter quelques outils :

Meaning Search ou recherche sémantique :
Google va étendre ses fonctions d’analyse sémantique de premiers niveaux pour intégrer le traitement des requêtes sémantiquement complexes.

The Universal Search :
Google intégrera la recherche universelle dans ses pages de résultats : lors d’une recherche sera directement présent des informations hétérogènes : Cartes, Images, Livres, Vidéos…

Google Expérimental :
Création d’un interface de béta-test permettant d’expérimenter en grandeur nature l’intégration de nouveaux modules et d’outils du moteur de recherche Google.
Google Expérimental Labs les outils présents : raccourci clavier de navigation entre les résultats – menu contextuel –

Google CLIR :
Fonctionnalité qui permet de regrouper dans le temps ou dans l’espace des résultats de recherche moteur. A travers le temps à l’aide d’un axe temporel et l’espace par l’intermédiaire de la carte du monde .

Exemple de la bibliographie du générale De Gaulle

Exemple de la carte des villes olympiques

Voir la Video Google Searchology Day

Source : YOODA

 Le Visual Shopping de Like.com, innovation web !

Alors que Google viens d’annoncer la tiède « révolution de la recherche universelle» , je souhaite mettre à nouveau en avant ce qui est à mon sens l’innovation majeure des derniers mois : le moteur de shopping par analogie visuelle de la société Riya : Like.com

Lancé en novembre 2006, Like.com n’est rien moins que la première application de recherche véritablement visuelle. La société Riya avait déjà fait parlé d’elle en novembre 2005 en sortant le premier moteur de recherche visuel, permettant notemment la reconnaissance faciale ! Innovation restée relativement confidentielle, hormis lors d’une tentative avortée d’achat par Google.
Il existe déjà de nombreux moteurs de recherche d’images sur le web, mais ces recherches d’images se basent uniquement sur les texte attachés aux images. Like.com utilise à la fois le texte et l’image elle même pour répondre aux requêtes.
Le principe de base est que vous définissez une image de référence, et Like vous trouve des produits
visuellement analogues. Par exemple, vous repèrez une montre Camel dont vous appréciez particulièrement le design, mais un peu chère pour votre bourse.  Soit vous faites une recherche directe avec « camel»  dans la rubrique « swatches»  de Like.com, soit vous uploadez directement votre photo. La fonction « Likeness search»  va vous permettre de rechercher une objet visuellement proche.

 Le résultat est assez saisissant et ouvre des perspectives vraiment nouvelles en termes d’achat sur internet. Ainsi, vous pouvez retrouver la dernière paire de pompe portée par Cameron Diaz, voire une similaire mais moins chère. Ou encore racheter la lampe que vous avez lamentablement cassé à l’aide d’une photo du dernier repas de famille.

D’autres options de recherche existent, mais je vous laisse le soin de les découvrir. Seul inconvénient, les boutiques référencées sont uniquement américaines, ce qui empêche une utilisation opérationnelle pour nous français.

like.com, moteur de shopping visuelRiya, recherche visuelle et reconnaissance facialeGoogle’s Universal Search

Source : Inferences : netmatketing et référencement

 Lausanne, la francophone, rejoint Google Book Search

Après le Royaume-Uni, l’Espagne et l’Allemagne, la Suisse est le quatrième pays européen, le premier francophone, à rejoindre le projet de bibliothèque numérique lancé fin 2004 par Google. Dans le cadre de l’accord signé entre le groupe Internet américain et la Bibliothèque cantonale et universitaire de Lausanne (BCU), plus de 100.000 ouvrages anciens, libres de droit, vont être numérisés afin qu’ils puissent être accessibles via Google Recherche de Livres (Book Search). Des ouvrages des 17e, 18e et 19e siècles sont concernés, romans (Hugo, Balzac, Stendhal, Tissot, Montolieu, Charrière, etc.) essais et sciences humaines (Germaine de Staël, Benjamin Constant, Jean de Sismondi…)

Ces ouvrages sélectionnés par la BCU seront numérisés en Angleterre par les soins et aux frais de Google pour un coût estimé à 7 millions d’euros. « Les livres seront accessibles gratuitement (et) nous avons par contrat le droit de mettre nos livres numérisés sur notre site Internet, lequel sera gratuit et entrera en fonction au plus tard en septembre 2008 » a indiqué Hubert Villard, directeur de la BCU, à l’agence de presse suisse ATS.

Une douzaine d’établissements sont, à ce jour, partenaires du projet de Google (Library Project) dont : Harvard, Stanford, Oxford (UK), Princeton, la New York Public Library (NYPL), Complutense Madrid, la Bibliothèque de Barcelone et la Bibliothèque d’Etat de Bavière. Empêtrée dans Quaero, la France a, jusqu’ici, boudé le projet.

 Les critères de positionnement sur Google

Rand Fishkin, fondateur de SEOmoz (société de prestations en search marketing), a publié récemment une étude collective sur les principaux facteurs présumés qui composent l’algorithme de classement des pages de résultats dans le moteur de recherche Google.

Près d’une quarantaine de spécialistes américains, reconnus pour leur expertise dans le domaine du SEO, ont participé à cette étude. Chacun de ces experts a été invité à juger du degré d’importance (via l’attribution d’une note allant de 1 à 5) et à commenter chacun des principaux critères utilisés par Google pour classer une page au sein de ses résultats de recherche.

Les critères de classement ont été répartis en plusieurs catégories (présence et mise en valeur de la requête au sein de la page, autres critères «on the page», popularité du domaine, attributs des liens externes, critères «négatifs» de mauvais ranking d’une page).

A l’intérieur des catégories, les facteurs de ranking ont été évalués et analysés tour à tour par chacun des intervenants. Chaque critère s’est vu décerner une note moyenne (calculée à partir des notes de chacun des experts participants à l’étude) d’importance pour le ranking.

Voici, résumées et traduites, les analyses des contributeurs sur les critères de classement liés à la place et la mise en valeur de la requête dans la page (par ordre décroissant d’influence du ranking).

Présence de la requête dans la balise title (note moyenne : 4,9) : tous les experts de l’étude sont unanimes à souligner l’importance historiquement capitale de ce facteur. Beaucoup soulignent aussi les effets bénéfiques sur le taux de clics d’une bonne optimisation des balises title. Caveman prévient cependant du danger de «duplicate content» si la balise title est identique sur toutes les pages d’un site alors que Aaron Wall met en garde contre les titres peu descriptifs (suite de mots-clés).
Utilisation de l’expression recherchée dans le corps de la page (note moyenne : 3,7) : les avis sont partagés, à l’image de Jill Whalen, Ben Pfeiffer ou Caveman qui attribuent un rôle-clé à ce critère alors qu’à l’inverse, Michael Gray affirme qu’il est possible de bien positionner une page sans la présence de la requête au sein du body si la page en question bénéficie d’un fort trustrank ou d’une présence de la requête dans les ancres de liens entrants. Rae Hoffman et Aaron Wall mettent de leur côté en garde contre la répétition excessive (risque de spam à l’encontre des moteurs) d’un même mot-clé. Une synthèse d’opinion se dégage tout de même sur la nécessité d’associer un maximum d’expressions thématiquement proches du mot-clé pour lequel la page a été optimisée : c’est cette sémantisation de la page, bien plus que le nombre d’occurrences du mot-clé, qui est importante aux yeux de la plupart des experts sondés : elle permet une meilleur identification du sujet de la page par les moteurs et génère plus de trafic potentiel via le phénomène de «longue traîne».

Rapports sémantiques du mot-clé avec le reste du texte (note moyenne : 3,4) : l’accord entre les participants est quasi-total pour souligner l’attention croissante que Google porte à la thématique d’une page (ou d’un site) dans ses critères de classement. Une écriture « naturelle », génératrice de synonymes du mot-clé de la requête, renforcera le domaine sémantique de la page et boostera celle-ci dans les résultats de Google, à la fois sur le mot-clé de la requête et sur ceux sémantiquement proches (processus de la « longue traîne»).

Insertion du mot-clé dans une balise H1 (note moyenne : 3,4) : les opinions divergent radicalement sur ce facteur : tandis que Russ Jones et Thomas Bindl écrivent en chœur qu’il s’agit du second critère de positionnement « on the page » le plus important, Jill Whalen, Caveman et Todd Malicoat insistent sur la surestimation, voire le peu d’importance de cette balise dans le cadre d’une stratégie de SEO. Caveman affirme même qu’il a positionné de nombreux sites sans l’aide d’aucune balise H1 et met en garde avec Aaron Wall contre d’éventuels risques de «duplicate content» si le contenu de cette balise est identique aux balises title et description.

Présence du mot-clé dans le nom de domaine (note moyenne : 3) : l’accord entre les experts est total : le bénéfice en terme de positionnement est très faible, voire quasi-nul. Les intervenants mettent par contre en évidence l’intérêt d’un tel nom de domaine pour un netlinking (textes des liens de sites externes constitués par le nom de domaine) et un taux de clics performants (mot-clé de la requête qui apparaît au sein des résultats de recherche en gras dans le nom de domaine).

Présence du mot-clé dans l’url de la page (note moyenne : 2,8) : même analyse que pour le critère précédent.

Insertion du mot-clé dans une balise H2, H3, H(x)… : (note moyenne : 2,8) : conclusions identiques au facteur «Insertion du mot-clé dans une balise H1» (voir plus haut).

Présence du mot-clé dans les tags alt et title des images (note moyenne : 2,5) : influence dans la plupart des cas négligeable voire inexistante pour un positionnement dans les pages de résultats «web», de par l’avis unanime des intervenants, qui soulignent cependant d’une même voix le rôle stratégique de ces tags pour un bon ranking au sein de la recherche images de Google et une meilleur accessibilité du site. Seuls les tags associés à des images cliquables (liens graphique) revêtent de l’importance dans le ranking (ces tags prennent alors la même valeur que les ancres des liens textes).

Mise en gras du mot-clé par le tag bold/strong (note moyenne : 2,4) : relativement peu de poids dans le cadre d’une stratégie de positionnement, plus important pour attirer l’oeil de l’internaute et mettre en valeur la thématique de la page.

Insertion du mot-clé dans la balise description (note moyenne : 2,1) : nos experts parlent d’une seule voix : cette balise a une influence nulle en terme de ranking mais demeure fondamentale pour contrôler l’affichage du contenu des pages au sein des résultats de recherche et optimiser ainsi leur taux de clics. Balise également très utile, lorsqu’elle est personnalisée sur chaque page, pour éviter le phénomène de «duplicate content». Aaron Wall et Caveman attirent notre attention sur le risque de déclassement si la balise description est identique au titre de la page.

Présence du mot-clé dans la balise keywords (note moyenne : 1,2) : influence nulle sur le ranking : Google n’indexe plus son contenu.

L’analyse des autres critères de classements de cette étude sera abordée dans le prochain numéro