« TemaTres, logiciel libre de gestion de thésaurus | Accueil | Archives, Secrétariat, Bibliothèque, Documentation, Veille : Périple d'un utilisateur* »

28 juillet 2006

Mots clés saisis par les internautes

OneStat, société de mesure d'audience, annonce les résultats de son baromètre concernant le nombre de « mots » saisis pour une requête sur les moteurs de recherche.

Sur ce premier tableau, l’étude des chiffres depuis 2003 (*1) montre une baisse constante des requêtes constituées d’un seul « mot », passant de 24,76% à 11,43% pour 2006.

Keyword_annee

Un aspect intéressant de ce dernier baromètre est la présence de statistiques par langue.

Keywordlangue

Nous avons seulement extrait les chiffres pour l’anglais, le français et l’allemand. Ceux-ci sont très sensiblement différents pour ces trois langues avec 28,89 % pour un mot et 40,04% pour deux mots pour l'Allemand.
Cela montre simplement que les langues fonctionnent de façon différente, ce que beaucoup oublient …
avec des langues synthétiques comme l’allemand (*2) grâce à des opérations morphologiques et des langues analytiques par constructions syntaxiques comme le français.

Et cela change les statistiques et surtout modifie la lecture de ces baromètres.

Quelques exemples :

- le mot le plus long :

  • en français : Anticonstitutionnellement (25 lettres)
  • en allemand : Rindfleischetikettierungsüberwachungsaufgabenübertragungsgeset
    (« loi sur le transfert des obligations de surveillance de l'étiquetage de la viande bovine et de la désignation des bovins » (mot officiel – dans un texte de loi, de 63 lettres)

- technique de conversion des déchets (3) = Abfallumwandlungsmethode (1)
- réduction du temps de travail (3) = Arbeitszeitverkürzung (1) = reduction of working time (3)
- première phase du championnat (3) = Hinrunde (1)
- location de voiture (2) = Wagenvermietung (1)
- partenaires sociaux (2) = Sozialpartner (1)
- conditions de travail (2)= Arbeitsbedingungen (1)
- centrale de chauffage alimentée par des déchets ( !) = waste-fed heating plant = Müllheizwerk (1)
- accord de libre-échange (2) = Freihandelsabkommen (1) = free-trade agreement
- usine de traitement des déchets (3) = Abfallbehandlungsanlage (1)
- position (de) hors-jeu (2) = Abseitsstellung (1)

Des chiffres donc différents pour ce qui concerne le nombre de mots d’une requête.
Mais bien sûr des contraintes et des résultats également différents dans la recherche sur les moteurs ….

  • condition travail canicule (508 000 / Google.fr) ou "conditions de travail" canicule (93000)
  • Arbeitsbedingungen Hitze (96000 / Google.de)

Une étude comparée franco-germanique des mots de la Constitution - qui reste à venir :-) - serait vraiment intéressante : un autre regard sur la constitution ?

Note
*1 Impossible de re)trouver des données équivalentes pour les années précédent 2003.
*2 Les coûts de traduction en allemand s’évalue à la ligne et non au mot.

Sources
L’article du 25/07/2006 sur JDN
Les données sur le site de OneStat.com
Constitution européenne (http://europa.eu/constitution/fr/lstoc3_fr.htm )
Les thésaurus Gemet ou Eurovoc, ainsi que le glossaire bilingue du football de l’Office franco-allemand pour la jeunesse (http://www.ofaj.org/).

TrackBack

URL TrackBack de cette note:
http://www.typepad.com/t/trackback/212377/5530432

Voici les sites qui parlent de Mots clés saisis par les internautes:

Commentaires

Flux Vous pouvez suivre cette conversation en vous abonnant au flux de commentaires pour cette note.

Poster un commentaire

Si vous avez un compte TypeKey ou TypePad, merci de vous identifier

Dico Eng-Fre


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004