« mars 2006 | Accueil | mai 2006 »

30 avril 2006

Des thésauroglossaires en sciences de l'information

Commençons par le T-Rex - Terminosaurus Rex - Die Informationswissenschaft in Begriffen (Notions en science de l’information).
Proposé depuis 2000 par le département universitaire des sciences de l’information de l’université de Saarbrück en Allemagne (présentation en français et en anglais), un thésauro-glossaire en sciences de l’information enrichi par des liens vers des ressources bibliographiques en ligne sur le web ou non. Cette terminologie a été mise à jour en 2002, puis 2004.
Un thésaurus donc avec des relations : générique (Oberbegriff), spécifique (Unterbegriff), synonyme ou associative (verwandte). Une entrée par saisie directe, une navigation par plan de classement et un index des termes en anglais sont proposés.

Il est toujours intéressant de regarder l’organisation de cette classification, qui distingue langage d’indexation et langage de recherche.... Ainsi Thésaurus se trouve en Recherche d’information, et le terme « indexation basée sur thésaurus » (thesaurus based indexing = thesaurusbasierte Erschließung) est une méthode complémentaire d’indexation, la méthode centrale étant la méthode automatique….
La langue allemande nécessite des techniques capables de traiter chacune des parties composant les termes. Ainsi une recherche sur Indexierung propose : automatische und computergestützte,…Indexierung,… Intellektuelle Indexierung….mais aussi  Volltextindexierung.
Navigation et ergonomie performantes.

Dans le même genre, on peut citer :

- la « Terminologie de base en sciences de l'information » (2002),  bilingue français et anglais, proposé par l’EBSI, également présenté  sous forme de thésaurus;

- le Thésauroglossaire des langages documentaires : un outil de contrôle sémantique (2001), de Danièle Dégez et Dominique Ménillet, aux éditions de l’ADBS, malheureusement uniquement en version papier

- et le Vocabulaire de la documentation (2004)   coordonné par Arlette Boulogne, également aux éditions de l’ADBS, dont nous avons trouvé, tout à fait par hasard au cours de nos périgrinations webiennes, des traces électroniques sur le site de TV5.
Ainsi ce dictionnaire/traducteur conçu par Alexandria** de Mémodata intègre outre Wordnet, le dictionnaire informatisé très utilisé en TAL (traitement automatique des langues), ledit Vocabulaire de la documentation de l’ADBS. (attention à ne pas confondre ce dictionnaire/traducteur avec le Dictionnaire multifonction proposé également sur TV5).
Au hasard, l’exemple du terme « thésaurus » ! Mieux encore, le vocabulaire de l’ADBS proposant un index en 4 langues (fr, en, de, es), vous pouvez faire une recherche par exemple en allemand avec « Indexierung » …
Nous aurons l’occasion de revenir sur les outils comme Alexandria…et si vous êtes comme moi non germanophone, ce dico-traducteur vous aidera dans la visite du T-Rex entièrement en allemand !

En anglais, toujours d’actualité :

- Glossary of terms relating to thesauri and other forms of structured vocabulary for information retrieval, de Leonard Will,  (Revised 2006-04-21 (qui n'est pas un thésauroglossaire)

- Controlled Vocabularies: A Glosso-Thesaurus, Fred Leise, Karl Fast, Mike Steckel, 10/27/2003

Cette note sera complétée ultérieurement pour les ressources en espagnol... nombreuses...

17 avril 2006

RIAO... 2007

Le 8ème congrès « RIAO* 2007 » se tiendra à l’Université Carnegie-Mellon à Pittsburgh (USA) du 30 mai au 1er juin 2007.

Vous avez donc le temps de vous préparer….

Co-organisé par le CID et l’IRIT (Institut de recherche en informatique de Toulouse), les thèmes 2007 tourneront autour de « l’Accès Sémantique à Grande Échelle au Contenu (Texte, Image, Vidéo et Son) »

Cette conférence mixe - comme toujours avec RIAO - des présentations de communications scientifiques et des démonstrations de prototypes industriels innovants (après appel à produits, validés et sélectionnés par un comité adhoc).

* RIAO, dont la 1ère manifestation date de 1985, signifie : Recherche d’Information Assistée par Ordinateur…

05 avril 2006

The American Society of Indexers (ASI)

Créée en 1968, l’ASI vise - comme ses consoeurs britannique et canadienne - la promotion de cette activité et des indexeurs. L'association est structurée en Chapitres "régionaux" (Chapters) et en Groupes de travail (SIG - spécial interest groups). La plupart des groupes ou régions ont leurs propres sites.

Une offre large est proposée aux adhérents : groupes de travail, répertoire des indexeurs, 6 numéros d’une revue interne, des réductions sur les ouvrages publiés et les conférences. A la fois syndicat et association professionnelle, de façon très pragmatique, l’adhésion offre également des réductions avec DHL pour les transports de travaux, des programmes de formation dans deux universités et une très intéressante promotion sur la revue internationale (anglaise) « The Indexer ».

Le site foisonne de ressources sur l’indexation (histoire, ouvrages et bases de données, …), mais aussi de ressources plus pratiques pour les indexeurs : revues spécialisées, logiciels, organisations professionnelles, ressources en ligne dont les répertoires des éditeurs , méthode et formation, exemples d’index.
Le répertoire des indexeurs référence 167 indexeurs aux USA. L’adhésion (hors répertoire) coûte 123 euros (150$) pour les personnes individuelles et 409 euros (500$) pour les organismes… quand même.
Les thèmes des groupes de travail (SIG) donne la mesure de la variété des domaines d’intervention : Business , Culinary , Gardening/Environmental, Genealogy/Transcription, History/Archaeology, Politics/International Relations, Psychology/Sociology , Scholarly Indexing, Science/Medicine, Sports/Fitness, Web Indexing.

Les indexeurs de l'amérique du nord ne sont pas tous dans le répertoire de l'ASI. Voici une autre source :  Indexers Unlimited

Le congrés annuel de l'ASI se déroulera en 2006 à Toronto (Canada) en collaboration avec la Société canadienne pour l'analyse des documents". Un programme alléchant !

02 avril 2006

Thésaurus d'éthique des sciences de la vie

Ce thésaurus dont la 2ème version est sortie en 2005, élargit la couverture de l'éthique aux domaines non humains comme l’éthique de l’animal, l’éthique de la protection de la nature ou de la biotechnologie…D'où un volume de 2844 notions en regard par exemple des 966 notions du thésaurus de l'Inserm sur ce même domaine, avec lequel il est en concordance.

On y trouvera donc des notions spécifiques au domaine de l’éthique comme « diagnostic de préfécondation » mais aussi « droit de guérir » ou  « dignité humaine », termes pour lesquels il n’y a aucune concordance avec 4 thésaurus pris en compte dans ce travail. Ou encore des termes liés aux domaines de l’agriculture (épandage d’engrais), du droit ou de l’écologie (effet de serre)…nécessaires aujourd'hui pour prendre en compte l'ensemble du champ.

Trilingue (fr, en et de), chacune des versions linguistiques reste toutefois indépendante "afin de garantir que les descripteurs propres à chaque version linguistique correspondent aux termes réellement utilisés dans le débat professionnel et la littérature spécialisée".

Un important travail de concordance a également été réalisé avec 4 thésaurus, 3 thésaurus de partenaires et le MeSH.

Quelques chiffres :
- 2844 descripteurs et 889 non-descripteurs en Français (3478 non descripteurs en anglais)
avec comme concordance:
- 657 avec Bioethics Thesaurus (USA)
- 917 avec Euroethics Thesaurus (DE) dont le développement a été suspendu
- 966 avec Thesaurus d'éthique des sciences de la vie et de la santé (Inserm)
- 1516 avec le MeSH (en fr ou en)

Le thésaurus produit au sein de l’Inserm axé sur la bioéthique, est totalement couvert par ce nouveau thésaurus. Il est intéressant d’étudier la place du MeSH, plus volumineux et résolument axé sur le monde médical. Le Bioethics thesaurus, maintenant intégré au MeSH, avait un recouvrement de 90% avec le MeSH (ce qui a fait l'objet de débats en son temps). Ce nouveau thésaurus en prenant en compte l'ensemble des problématiques d'éthique se distingue plus fortement du MeSH et permet de traiter une information parfois délicate et en forte évolution, avec des termes plus précis.

L'interface de recherche et navigation dans le thésaurus autorise la sélection au fil de la navigation dans le langage de plusieurs termes avant le lancement de la recherche sur la base de données. Un usage cohérent avec le principe de la combinaison de termes propre à ce type de langage.

Une belle coopération entre ces 5 instituts et un pilotage rigoureux par le DRZE (Deutschen Referenzzentrum für Ethik in den Biowissenschaften) à Bonn.

Les notes récentes


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004