« La Société canadienne pour l'analyse de documents / The Indexing and Abstracting Society of Canada | Accueil | Catégorisation : organiser les résultats de recherche »

26 août 2005

Zthes, profil Z39.50 pour la navigation dans un thésaurus


Zthes est un profil Z39.50 qui permet de naviguer et de sélectionner des termes au sein d’un thésaurus. Ce profil définit un modèle abstrait pour représenter les termes du thésaurus utilisables dans une recherche sous la forme d'une DTD XML Zthes, ainsi que les moyens pour implémenter ce modèle.
Nous présentons brièvement les finalités de Z39.50 et de ses profils, ainsi que le profil Zthes. Un extrait d'un thésaurus présenté selon la DTD Zthes est exposé à la fin de la note.


Les profils Z39.50

La norme ANSI/NISO Z39.50 définit un protocole permettant à deux serveurs de communiquer entre eux pour formuler une recherche, extraire des informations et les présenter.
Ce protocole définit une base de données « abstraite » et un ensemble de fonctions à réaliser sur celle-ci : rechercher et extraire des données, consulter des index ou un thésaurus,…

Dans ce cadre, des profils, applications particulières autour de Z39.50, se sont développés.
Un profil identifie un jeu de normes de base ainsi que les options et les paramètres appropriés nécessaires à un contexte donné : recherche, sélection dans un index,…

Des références sur le sujet :

  • Une note et un site sur Z39.50 Z39.50 :
    • une norme en mutation, Nicolas Morin, 2001 (site http://morinn.free.fr/)
    • Z39.50, Dominique Lahary, dernière date de mise à jour 18 mars 2003, http://membres.lycos.fr/vacher/profess/cours/mediadix/z3950/url.htm

Un exemple dans un autre secteur
Le profil GEO Z39.50 permet d'incorporer la norme de contenu de métadonnées géospatiales numériques du FGDC (Federal Geographic Data Committee - USA).

Le profil Zthes Z39.50 ?

Zthes est un profil Z39.50 qui concerne la navigation dans des thésaurus, ceux-ci suivant la norme ISO 2788 et peuvent être bilingues.

Le profil définit un modèle abstrait pour représenter les termes du thésaurus utilisables dans une recherche, ainsi que les moyens pour implémenter ce modèle avec le protocole Z3950 et des suggestions pour être utilisé avec d’autres formats ou protocoles.

Modélisation et représentation des termes du thésaurus : Zthes

Le thésaurus est considéré ici comme une base de données. Chacun des termes du thésaurus, y compris les non-descripteurs, constitue un enregistrement de cette base. La structure de représentation des termes du thésaurus suit un modèle commun qui inclut les métadonnées associées à la norme internationale ISO 2788 (et ISO 5864 pour le bilinguisme) tels que terme, type de terme, relations,…, et des métadonnées spécifiques à l’application : base cible, champ concerné, occurrence du terme dans la base cible. La présentation des termes peut suivre deux formats : complets ou courts, suivant en cela les propositions pour les ensembles de données proposées par Z39.50.

Remarque

  • Comme dans n’importe quelle base de données, chaque enregistrement est identifié par un identifiant, en général un numéro unique. Ce principe n’est que très rarement mis en œuvre dans les logiciels de gestion de thésaurus.
  • Tous les termes y compris les non-descripteurs étant identifiés, il existe une métadonnée termType qui permet de les distinguer précisémment : PT pour terme préférentiel (descripteur); ND pour non-préférentiel (non-descripteur) ; NL pour relais virtuel.

Requêtes possibles

En exploitant ce double protocole (Zthes et Z3950), il est possible de répondre à de nombreuses requêtes qui correspondent dans ce contexte à des services Zthes :

  • recherche à partir d’un identifiant ou d’un terme (chaîne de caractères) ;
  • trouver des mots dans les enregistrements ;
  • trouver les termes spécifiques d’un terme donné ;
  • trouver les termes génériques d’un terme donné ;
  • trouver les termes associé d’un concept donné ;
  • trouver le terme préférentiel d’un concept donné ;
  • trouver les termes non-préférentiels d’un concept donné ;
  • trouver des termes associés d’un concept donné ;
  • trouver des équivalents linguistiques d’un terme donné

Prise en compte des technologies des Services Web : Zthes for SWR

Le protocole Zthes a été défini en 1999, époque déjà ancienne pour le monde du Web ! 
Zthes a été récemment redéfini en prenant en compte le développement des Services Web, en particulier les SRW (Search/Retireval Web service).

Evolutions fonctionnelles de Zthes

Ces évolutions visent :

  • la prise en compte des versions
  • la prise en compte de la combinaison de termes pour représenter un concept complexe (extraction de charbon EM charbon + extraction minière)
  • l’utilisation de termes considérés comme appropriés comme point de départ d’une navigation.
  • des termes dont les notes contiennent des mots spécifiques
  • des termes dans une langue spécifique


Présence dans les logiciels

Il existe très peu de logiciels spécialisés, documentaires voire de gestion de thésaurus, qui proposent à l’export des données, le format Zthes.
Nous avons repéré Idesia d’Archimed et Cognatrix de LGOSystems.
Beaucoup d’autres produits proposent des exports XML, mais sans DTD associée.
Cette liste est bien sûr à affiner.

En conclusion

Nous venons de voir un schéma de modélisation de thésaurus pour un usage et un contexte précis : la récupération de termes dans le cadre d’une recherche documentaire Z39.50. 

Ce schéma Zthes doit être appréhendé parallèlement d'une part à l’évolution des normes sur les thésaurus (une nouvelle norme NISO/ANSI sur les vocabulaires contrôlés a été validée en juillet 2005), et d'autre part les travaux du Web sémantique en particulier SKOS qui travaillent sur la modélisation RDF des thésaurus.

Ressources

  • Le portail Zthes, http://zthes.z3950.org/ Zthes DTD XML version 0.5, 19 Oct 2001, http://zthes.z3950.org/xml/zthes-05.dtd
  • Zthes: a Z39.50 Profile for Thesaurus Navigation, version 0.5, 6th November 2001, Mike Taylor, http://zthes.z3950.org/profile/zthes-05.html
  • Zthes Profile for SRW, version 0.5, 12th December 2003, Mike Taylor http://zthes.z3950.org/srw/current
  • Des exemples : Thesaurus on the internet, 25th July 2002, http://zthes.z3950.org/thes/index.html
  • OCLC Research: Terminology Services Project, http://staff.oclc.org/~vizine/GSAFD/Zthes/2004-05-26/
  • Liste de documents à caractère normatif (sur le site, rubrique Normes)


Un exemple Zthes

Etabli à partir de quelques termes issus du thésaurus sur la Discrimination raciale, Service d’information antiracisme (ARIS), février 2005.

Attention : Le gras apparaissant sur certains termes et codes a été rajouté par  l'auteur et ne fait pas parti du modèle.

<Zthes>   
- <term>
   <termId>ATD0000001</termId>
   <termName>Discrimination</termName>
   <termType>PT</termType>
-<termNote>
La discrimination implique tout acte ou conduite qui nie à certains individus l’égalité de traitement par rapport à d’autres individus parce qu’ils appartiennent à un groupe particulier de la société. » (Secrétaire général des Nations Unies, Les principaux types et les principales causes de discrimination, publication des Nations Unies, n° de vente 49, XIV.3.)
</termNote>
   <termCreatedDate>2004-07-20</termCreatedDate>
   <termCreatedBy>SD</termCreatedBy>
   <termModifiedDate>2004-11-22T14:13:52.0</termModifiedDate>
   <termModifiedBy>SD</termModifiedBy>
-<relation>
   <relationType>UF</relationType>
   <termId ATD0000002</termId>
   <termName>groupes désavantagés</termName>
   <termType>ND</termType>
</relation>
-<relation>
   <relationType>UF</relationType>
   <termId>ATD0000003</termId>
   <termName>intolérance</termName>
   <termType>ND</termType>
</relation>
-    <relation>
   <relationType>RT</relationType>
   <termId>ATD0000025</termId>
   <termName>préférence</termName>
   <termType>PT</termType>
</relation>
-<relation>
   <relationType>NT</relationType>
   <termId>ATD0000006</termId>
   <termName>discrimination ethnique</termName>
   <termType>PT</termType>
</relation>
-<relation>
   <relationType>NT</relationType>
   <termId>ATD0000035</termId>
   <termName>exclusion</termName>
   <termType>PT</termType>
</relation>
-<term>
   <termId> ATD0000035</termId>
   <termName>exclusion</termName>
   <termType>PT</termType>
   <termCreatedDate>2004-07-20</termCreatedDate>
   <termCreatedBy>SD</termCreatedBy>
   <termModifiedDate>2004-11-26T14:13:52.0</termModifiedDate>
   <termModifiedBy>SD</termModifiedBy>
</relation>
-<relation>
   <relationType>UF</relationType>
   <termId>ATD0000036</termId>
   <termName>marginalisation</termName>
   <termType>ND</termType>
</relation>
-<relation>
   <relationType>BT</relationType>
   <termId> ATD0000001</termId>
   <termName>Discrimination</termName>
   <termType>PT</termType>
</relation>
…..
 

TrackBack

URL TrackBack de cette note:
http://www.typepad.com/t/trackback/212377/3068734

Voici les sites qui parlent de Zthes, profil Z39.50 pour la navigation dans un thésaurus:

Commentaires

Poster un commentaire

Si vous avez un compte TypeKey ou TypePad, merci de vous identifier

Les notes récentes


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004