Zthes est un profil Z39.50 qui permet de naviguer et de sélectionner des
termes au sein d’un thésaurus. Ce profil définit un modèle abstrait pour représenter les termes du
thésaurus utilisables dans une recherche sous la forme d'une DTD XML Zthes, ainsi que les moyens pour
implémenter ce modèle.
Nous présentons brièvement les finalités de Z39.50 et de ses profils, ainsi que le profil Zthes. Un
extrait d'un thésaurus présenté selon la DTD Zthes est exposé à la fin de
la note.
Les profils Z39.50
La norme ANSI/NISO Z39.50 définit un protocole permettant à
deux serveurs de communiquer entre eux pour formuler une recherche,
extraire des informations et les présenter.
Ce protocole définit
une base de données « abstraite » et un ensemble de fonctions à
réaliser sur celle-ci : rechercher et extraire des données, consulter
des index ou un thésaurus,…
Dans ce cadre, des profils, applications particulières autour de Z39.50, se sont développés.
Un
profil identifie un jeu de normes de base ainsi que les options et les
paramètres appropriés nécessaires à un contexte donné : recherche,
sélection dans un index,…
Des références sur le sujet :
- Le site officiel Z39.50
- Définition des profils: http://lcweb.loc.gov/z3950/agency/profiles/about.html
- Profils de Z3950 : http://lcweb.loc.gov/z3950/agency/profiles/profiles.html
- Une note et un site sur Z39.50
Z39.50 :
- une norme en mutation, Nicolas Morin, 2001 (site http://morinn.free.fr/)
- Z39.50, Dominique Lahary, dernière date de mise à jour 18 mars 2003, http://membres.lycos.fr/vacher/profess/cours/mediadix/z3950/url.htm
Un exemple dans un autre secteur
Le profil GEO Z39.50
permet d'incorporer la norme de contenu de métadonnées géospatiales
numériques du FGDC (Federal Geographic Data Committee - USA).
- Z39.50 Application Profile for Geospatial Metadata or "GEO",
Version 2.2,
- Qu’est-ce-que le profil Z39.50 GEO ? par GéoConnexions, http://geodiscover.cgdi.ca/about/fr/5.6.3.1.html#c
Le profil Zthes Z39.50 ?
Zthes est un profil Z39.50 qui concerne la navigation dans des thésaurus, ceux-ci suivant la norme ISO 2788 et peuvent être bilingues.
Le profil définit un modèle abstrait pour représenter les termes du thésaurus utilisables dans une recherche, ainsi que les moyens pour implémenter ce modèle avec le protocole Z3950 et des suggestions pour être utilisé avec d’autres formats ou protocoles.
Modélisation et représentation des termes du thésaurus : Zthes
Le thésaurus est considéré ici comme une base de données. Chacun des termes du thésaurus, y compris les non-descripteurs, constitue un enregistrement de cette base. La structure de représentation des termes du thésaurus suit un modèle commun qui inclut les métadonnées associées à la norme internationale ISO 2788 (et ISO 5864 pour le bilinguisme) tels que terme, type de terme, relations,…, et des métadonnées spécifiques à l’application : base cible, champ concerné, occurrence du terme dans la base cible. La présentation des termes peut suivre deux formats : complets ou courts, suivant en cela les propositions pour les ensembles de données proposées par Z39.50.
Remarque
- Comme dans n’importe quelle base de données, chaque enregistrement est identifié par un identifiant, en général un numéro unique. Ce principe n’est que très rarement mis en œuvre dans les logiciels de gestion de thésaurus.
- Tous les termes y compris les non-descripteurs étant identifiés, il existe une métadonnée termType qui permet de les distinguer précisémment : PT pour terme préférentiel (descripteur); ND pour non-préférentiel (non-descripteur) ; NL pour relais virtuel.
Requêtes possibles
En exploitant ce double protocole
(Zthes et Z3950), il est possible de répondre à de nombreuses requêtes
qui correspondent dans ce contexte à des services Zthes :
- recherche à partir d’un identifiant ou d’un terme (chaîne de caractères) ;
- trouver des mots dans les enregistrements ;
- trouver les termes spécifiques d’un terme donné ;
- trouver les termes génériques d’un terme donné ;
- trouver les termes associé d’un concept donné ;
- trouver le terme préférentiel d’un concept donné ;
- trouver les termes non-préférentiels d’un concept donné ;
- trouver des termes associés d’un concept donné ;
- trouver des équivalents linguistiques d’un terme donné
Prise en compte des technologies des Services Web : Zthes for SWR
Le protocole Zthes a été défini en 1999, époque déjà ancienne pour le monde du Web !
Zthes
a été récemment redéfini en prenant en compte le développement des
Services Web, en particulier les SRW (Search/Retireval Web service).
Evolutions fonctionnelles de Zthes
Ces évolutions visent :
- la prise en compte des versions
- la prise en compte de la combinaison de termes pour représenter un concept complexe (extraction de charbon EM charbon + extraction minière)
- l’utilisation de termes considérés comme appropriés comme point de départ d’une navigation.
- des termes dont les notes contiennent des mots spécifiques
- des termes dans une langue spécifique
Présence dans les logiciels
Il existe très peu de logiciels spécialisés, documentaires voire de
gestion de thésaurus, qui proposent à l’export des données, le format
Zthes.
Nous avons repéré Idesia d’Archimed et Cognatrix de LGOSystems.
Beaucoup d’autres produits proposent des exports XML, mais sans DTD associée.
Cette liste est bien sûr à affiner.
En conclusion
Nous venons de voir un schéma de modélisation de thésaurus pour un usage et un contexte précis : la récupération de termes dans le cadre d’une recherche documentaire Z39.50.
Ce schéma Zthes doit être appréhendé parallèlement d'une part à l’évolution des normes sur les thésaurus (une nouvelle norme NISO/ANSI sur les vocabulaires contrôlés a été validée en juillet 2005), et d'autre part les travaux du Web sémantique en particulier SKOS qui travaillent sur la modélisation RDF des thésaurus.
Ressources
- Le portail Zthes, http://zthes.z3950.org/ Zthes DTD XML version 0.5, 19 Oct 2001, http://zthes.z3950.org/xml/zthes-05.dtd
- Zthes: a Z39.50 Profile for Thesaurus Navigation, version 0.5, 6th November 2001, Mike Taylor, http://zthes.z3950.org/profile/zthes-05.html
- Zthes Profile for SRW, version 0.5, 12th December 2003, Mike Taylor http://zthes.z3950.org/srw/current
- Des exemples : Thesaurus on the internet, 25th July 2002, http://zthes.z3950.org/thes/index.html
- OCLC Research: Terminology Services Project, http://staff.oclc.org/~vizine/GSAFD/Zthes/2004-05-26/
- Liste de documents à caractère normatif (sur le site, rubrique Normes)
Un exemple Zthes
Etabli à partir de quelques termes issus du thésaurus sur la Discrimination raciale, Service d’information antiracisme (ARIS), février 2005.
Attention : Le gras apparaissant sur certains termes et codes a été rajouté par l'auteur et ne fait pas parti du modèle.
<Zthes>
- <term>
<termId>ATD0000001</termId>
<termName>Discrimination</termName>
<termType>PT</termType>
-<termNote>
La
discrimination implique tout acte ou conduite qui nie à certains
individus l’égalité de traitement par rapport à d’autres individus
parce qu’ils appartiennent à un groupe particulier de la société. »
(Secrétaire général des Nations Unies, Les principaux types et les
principales causes de discrimination, publication des Nations Unies, n°
de vente 49, XIV.3.)
</termNote>
<termCreatedDate>2004-07-20</termCreatedDate>
<termCreatedBy>SD</termCreatedBy>
<termModifiedDate>2004-11-22T14:13:52.0</termModifiedDate>
<termModifiedBy>SD</termModifiedBy>
-<relation>
<relationType>UF</relationType>
<termId ATD0000002</termId>
<termName>groupes désavantagés</termName>
<termType>ND</termType>
</relation>
-<relation>
<relationType>UF</relationType>
<termId>ATD0000003</termId>
<termName>intolérance</termName>
<termType>ND</termType>
</relation>
- <relation>
<relationType>RT</relationType>
<termId>ATD0000025</termId>
<termName>préférence</termName>
<termType>PT</termType>
</relation>
-<relation>
<relationType>NT</relationType>
<termId>ATD0000006</termId>
<termName>discrimination ethnique</termName>
<termType>PT</termType>
</relation>
-<relation>
<relationType>NT</relationType>
<termId>ATD0000035</termId>
<termName>exclusion</termName>
<termType>PT</termType>
</relation>
-<term>
<termId> ATD0000035</termId>
<termName>exclusion</termName>
<termType>PT</termType>
<termCreatedDate>2004-07-20</termCreatedDate>
<termCreatedBy>SD</termCreatedBy>
<termModifiedDate>2004-11-26T14:13:52.0</termModifiedDate>
<termModifiedBy>SD</termModifiedBy>
</relation>
-<relation>
<relationType>UF</relationType>
<termId>ATD0000036</termId>
<termName>marginalisation</termName>
<termType>ND</termType>
</relation>
-<relation>
<relationType>BT</relationType>
<termId> ATD0000001</termId>
<termName>Discrimination</termName>
<termType>PT</termType>
</relation>
…..
Les commentaires récents