09 août 2006

On n’est pas là pour se faire en Google.


Encore une nuit moite et tournoyante dans vos lits, cette chaleur… ça énerve… Même, l’autre, l’humain qui partage votre couche, celui que vous aimez, celui que vous attendiez sous la pluie, celui qui vous attendri comme c’est pas permis, le soleil de votre vie quoi, et bien, même ce soleil là, il vous donne des envies de meurtres par cette température.
Deux solutions possible : la rupture ou le canapé.

Et toi camarade célibataire, je n’ose imaginer ta douleur, quoi que… Toi qui rêves de nuits torrides, seul dans ton lit, tu peux toujours imiter la lettre X pour espérer avoir un peu fraîcheur et ne pas dégager ton (ta) partenaire d’un violent coup de pied (ou d’épaule, de coude. Le coup de boule étant toute fois réservé aux sportifs de haut niveau… Les coups de boules, quand à eux, pouvant être pratiqués par n’importe quel amateur normalement constitué.)

Tiens en parlant de nuits moites et torrides, tel le veilleur moyenâgeux, je maraude dans les ruelles électroniques, inspectant vos recoins sombres les plus normaux allant des lumineuses avenues aux vitrines spectaculaire marchande jusqu’aux endroits les plus interlopes et cosmopolites. Oyez brave gens, il est 4h 30, dormez en paix....

Mais le veilleur pense lors de ces rondes. Et il se demande quel est le mot le plus utilisé sur internet. Dans son pauvre esprit juste éclairée par son fanal falot, un mot s’impose a lui : SEXE !
L’offre web peut être grossièrement déduite du nombre d’indexations indiquées quand on a saisi la demande sur un moteur. Pourquoi grossièrement ? D’abord, parce que tout n’est pas indexé, loin s’en faut, ensuite du fait de la polysémie de certains termes, y compris sexe, enfin il y a aussi en cette matière comme en toute chose informatique, des aléas, et des comportements visant à piéger les moteurs pour attirer le chaland (spamdexing) . Mais à titre comparatif et à moteur constant, pour les effets massifs, le jeu est intéressant.

Ainsi de l’offre de "sexe", si l’on peut dire. En tentant comme la majeure partie des internautes après 20 heures le soir (selon la légende et Françoise Giroud) le mot magique dans un moteur plurilingue (parce qu’on est forcément un pervers polyglotte), on découvre ébahi un palmarès surprenant. La décomposition des résultats révise en effet nos clichés de « latin lover » par un classement web inédit. On nous apprend par exemple que le english sex est indexé 86,7 millions de fois. Gros, gros bazar...Le sexe avec un "e" à la fin vaut 11,6 millions. Super, mais le web français n’y est que pour 15% (grosse déception pour notre réputation nationale). L’hispanique sexo fait 3,6 millions, l’italien sesso 1,7 et le teuton seks 0,7.
Total, près de 100 millions : sacrée belle offre. Et je n’ai pas testé toutes les langues. La France - toujours aussi curieusement - n’y contribue que pour moins de 2%.

On pourra s’amuser à rechercher des indexations supérieures en France, on trouvera déjà au moins le mot France lui même (2,5 millions), ou Paris (1,9 millions), ou Internet (idem). Le web national n’est pas très sexy finalement. Par exemple, il y a de fortes offres dans des domaines aussi divers que "histoire" ou "jeux" (de taille équivalente à celle du sexe), ou bien "musique", "art", "monde", "web", "Europe", "photo", "famille", "droit", "informatique", "femme", "homme", "entreprise", "culture". Que du propre à plus d’1 millions d’indexations chacun, enfoncé le sexe, haha... Ce n’est pas du beau web, ça ?

Encore plus fort, sur le ring impitoyable du référencement, de beaux matchs improbables viennent perturber les vieux repères judéo bourgeois : amour (633 000) bat dieu (407 000) par KO, comme "love" bat "god". D’ailleurs dieu, tout puissant ou pas, se prend moult branlées. Peu bigot, le web, instrument du diable est aussi galant et poli : il donne la préséance aux dames, en vil suborneur expérimenté : "chienne(s)" fait ainsi mieux que "chien(s)" (mais pour des raisons douteuses, peut être), tout comme "femme" fait mieux qu’"homme", "maman" que "papa". Question homonyme, le "bit" vaut bien deux fois la "bite" et le correct "masturbation" écrase à plate couture le plus grossier "branlette" (180 000 contre 49 000). Quant à l’"érection", de bon goût, elle renvoie le vulgaire "trique" aux poubelles de l’histoire. C’est qu’il est correct le créateur web, contrairement à ce que pensent les censeurs.

Bien sûr, certains secteurs ont des offres limitées. Et Ce n’est pas pour me vanter, mais il fait vraiment un temps à ne pas mettre un socialiste dehors, comme aurait dit Desproges s’il avait connu internet. "Chirac", "Jospin", "parti" ne font pas mieux que "blagues", et nettement moins que "masturbation". L’offre politique est très en retrait sur l’offre onaniste, technique et culturelle. Désolé pour ceux qui vont avoir de la peine, mais "écologie" et "communisme" sont encore plus bas. Qu’ils se rassurent, ils pouront trouver mieux, il suffira de chercher (essayer Raffarin ou trotskyste par exemple). Et de dessinez ensuite le hit parade des participations au contenu web, il n’étonnera pas. Sans parler bien sur de l'ergonomie ou d’intérêt du contenu.

Au total, voyons les choses comme elles sont. L’offre de sexe web fait à coup sûr beaucoup moins de 10% de l’offre web globale. Qu’est ce qui me permet de dire ça, en dehors du spamdexing ? Le fait qu’il existe une offre à plus de 7 milliards (trouvez la) ; elle enfonce le sexe. Et du côté de la demande ? Car peut être ce texte donne-t-il l’impression qu’il y a d’une part une offre diversifiée, et d’autre part une bande de libidineux qui ne font que taper des requêtes sexuelles.
Faux. Car l’offre est plus diversifiée que l’on pense, et plus technico-culturelle que sexuelle, les demandes le sont donc aussi. Il faudrait pour l’apprécier correctement, mener un travail sur les requêtes. Déjà en 1999, il y a eu quelques éléments, sur 50 000 requêtes (Altavista et web crawler), qui allaient dans le sens de la diversité, résultats confirmés ultérieurement sur un échantillon beaucoup plus important.
Contrairement à l’opinion répandue par les médias traditionnels, les requêtes à caractère sexuel et les autres requêtes qui ont les fréquences les plus élevées ne constituent qu’une infime partie des requêtes sur les moteurs de recherche. La principale caractéristique de l’utilisation des moteurs de recherche est la singularité et la diversité des requêtes, quant aux 20 requêtes les plus populaires, elles ne représentent que 1,5% de l’ensemble des requêtes.

Oui messieurs dames, c’est le robot qui indexe qui est bête, les internautes qui sont marrants avec leurs questions fondamentales, et les auteurs qui ne pratiquent pas la langue de bois (ils appellent un chat bite couille salope cochonne et j’en passe pour ne pas choquer). Résultat, de grandes déceptions pour le chercheur, sans doute, ou une autre manière de voir le monde désormais, touché par la grâce de l’article à lire...

Oui, la notion de requête principale est bidon, il y en a tellement que les principales sont noyées. Alors, combien pour le sexe ? 1% ? Ca valait bien le coup de nous les briser avec ça et de faire peur aux pauvres internautes...

Les médias ont donc perrenisé la rumeur car une bonne croyance conventionnelle est plus utile au métier et à la carrière qu’une investigation sérieuse. CQFD, one more time, comme disait Shakespeare.