Après 4 années de dur labeur, la norme ISO25964-1 sur les thésaurus est (enfin !) publiée officiellement au 18 août 2011. Entre la version de projet de 2007 et la version de 2011, que de chemin parcouru, que d''échanges, de réflexion, de travail entre les membres des deux groupes, celui de l'Afnor en France et celui de l'ISO.
Vous pouvez donc maintenant l'acheter (!) sur le site de l'Afnor pour 198 euros (brrrr), le même tarif sur support numérique et papier (no comment).
Un site compagnon pour cette norme : la rubrique "Schemas" sur le site du NISO propose le schéma XML documenté de cette norme (informatif et non normatif, mais du coup gratuit pour les éditeurs, développeurs & co!), et le modèle de données associé. Heureusement que le NISO est là pour le dépôt de ces outils de première importance que sont les schémas XML(*). Merci à Johan De Smedt qui nous a concocté cette nouvelle version du schéma XML, avec un exemple en multilingue.
Rappel de la structure de la norme ISO 25964
La Partie 1 porte donc sur les thésaurus. La Partie 2 (pour le moment en Comitee Draft, nous espérons l'enquête publique pour fin 2011) couvrent l’interopérabilité entre différents thésaurus et d’autres types de vocabulaires structurés, tels que les taxonomies, listes d’autorité, ontologie,…
Les chapitres 1 à 14 de la Partie 1 de cette norme correspondent globalement au contenu des normes ISO 2788:1986 et ISO 5964:1985. Les autres chapitres de la Partie 1 ainsi que l’ensemble de la Partie 2 de la norme couvrent un nouveau périmètre non pris en charge par aucune norme internationale.
Quelques mots sur la partie 1 de la norme sur les thésaurus
La Partie 1 de la norme disponible couvre le développement et la maintenance de thésaurus, aussi bien monolingues que multilingues, et inclut les formats et les protocoles d’échange de données.
L'orientation "concept" a été renforcé et formalisé :
thésaurus : vocabulaire contrôlé et structuré dans lequel les concepts sont représentés par des termes, organisés de façon à ce que des relations entre les concepts soient explicitées, et dont les termes préférentiels sont accompagnés par des entrées vers leurs synonymes ou quasi-synonymes. / controlled and structured vocabulary in which concepts are represented by terms, organized so that relationships between concepts are made explicit, and preferred terms are accompanied by lead-in entries for synonyms or quasi-synonyms.
Dans ce contexte, le modèle de données distingue bien les (1) concepts et les (2) termes (chacun des termes étant associés à une langue), ainsi que les (3) "groupes de concepts" (domaines, champs sémantiques, ...) et (4) les facettes (quoi que ces dernières auraient pu être formalisées avec les groupes de concepts...). Le chapitre (7) est réservé au traitement des concepts dits complexes.
Un important effort de formalisation et sémantisation a été réalisé avec un modèle de données métier sous la forme d'un diagramme UML : classes d'objets, propriétés et relations fournissent un cadre qui devraient faciliter le développement d'applications et l'interopérabilité entre vocabulaires et systèmes.
On en a profité pour formaliser la représentation de concepts complexes par des équivalences composées de termes (les fameux Use et Use for : ainsi le concept transplantation de rein qui n'existe pas comme terme préférentiel dans le thésaurus doit être remplacé (USE) par deux termes(i.e. concepts) transplantation d'organe + rein).
Citons également le travail réalisé sur les degrés d'équivalence crosslingue : équivalence exacte, inexacte ou proche, partielle, non-équivalence.
Cette première partie disponible aujourd'hui intègre un chapitre (13) sur la gestion, la construction et la maintenance d'un thésaurus (le modèle porte d'ailleurs une classe spécifique pour la gestion des versions du thésaurus), et un autre chapitre portant sur les principes directeurs pour les logiciels de gestion de thésaurus. Les trois autres chapitres apportent des éléments sur (16) les usages des thésaurus (à l'indexation, à la recherche), (17) les formats d'échange et (18) les protocoles de recherche. Bien sûr SKOS est cité comme un format d'échange. Mais attention, comme j'ai l'habitude de le dire, SKOS est un format pour exploiter les vocabulaires (entre autre sur/dans le web) et ne contient pas tous les 'éléments qui pourraient être utiles en exploitation ou en gestion et maintenance. Le format iso25964 est donc important à implémenter...
Retiré à la demande de l'Afnor (En bilingue : Sommaire, Avant-propos, Introduction et champ d'application, liste des termes définis.) Ahh, vous attendez une version en français... Nous aussi ;-)
Un Livre blanc a été publié en 2013 reprenant les éléments principaux de la norme.
Ressources complémentaires en français millésime 2011
1. Hélène Rabaut (Lexis Nexis), Hélène Zysman (Smile - Open Source Solutions), Les schémas de concepts et le Web sémantique : la norme sur les thésaurus ISO 25964 [Presentation], In Journée Afnor/Bnf "Référentiels et données d'autorité à l'heure du Web sémantique", 2011 May 27 Available at: http://www.bnf.fr/documents/afnor2011_norme_thesaurus.pdf
2. ISKO-France, 27-28 juin 2011, Lille, Université Charles-De-Gaulle Lille 3
. ISO 25964 : vers une nouvelle norme pour l'organisation et l'accès à l'information et aux connaissances, Michèle HUDON - EBSI, Université de Montréal, Canada; http://conferences.isko-france.asso.fr/fr/abstracts/sa1a.htm
. Optimisation de la recherche bibliographique par une meilleure prise en compte des relations entre concepts et termes : le cas d'OTAREN (Apports de la recommandation SKOS et de la norme ISO 25964 en ce domaine). François FEYLER -- CNDP, http://conferences.isko-france.asso.fr/fr/abstracts/sc2a.htm
3. Présentation à l’attention d’éditeurs de logiciel de la future norme ISO 25964-1 : Thésaurus pour la recherche documentaire, Hélène Zysman, Sylvie Dalbin, mars 2011,, http://www.slideshare.net/Dalb/iso-25964-thsaurus-pour-la-recherche-documentaire.
4. ADBS, février 2011 -http://www.adbs.fr/une-nouvelle-norme-pour-le-thesaurus-1-pourquoi-une-nouvelle-norme--100316.htm?RH=1266334869518
(*) On attend de voir ce que va donner la "base de données des concepts ISO" (un exemple)
Les commentaires récents