Information et documentation -- Thésaurus et interopérabilité avec d'autres vocabulaires -- Partie 2: Interopérabilité avec d'autres vocabulaires
Un document totalement nouveau.
---------------------------------------------------------------------------------------------------
Actu du 05/03/2013 - La norme est publiée http://www.iso.org/iso/home/store/catalogue_tc/catalogue_detail.htm?csnumber=53658
---------------------------------------------------------------------------------------------------
Actu du 27/01/2012 - Le BSI (UK) nous met le projet de norme en ligne. Une simple inscription (gratuite) suffit.
------------------------------------------------------------------------------------------------------
2 années pour aboutir à un projet de norme mis à l'enquête (DIS) depuis le 15 décembre sur le site de l'ISO pour cette Partie 2 de la norme ISO 25964 (environ 80 euros - pour un document jettable, çà fait cher !) - l'enquête publique a démarré mi décembre 2011 et courre jusqu'à avril 2012.
Nous attendons avec impatience sa parution sur la plateforme du BSI sur les normes en projet dans un format simple à commenter.
Petit rappel : La partie 1 sur le thésaurus pour la recherche documentaire est parue en août 2011. Quelques éléments techniques dont le schéma XML se trouvent dans une rubrique dédiée sur le site du NISO.
Rédaction de ce projet de norme
- Groupe ISO -Stella Dextre Clarke (UK, Chair), Johan De Smedt (BE), Michèle Hudon (CA), Marianne Lykke Nielsen (DK), Jutta Lindenthal (DE), Daniel Kless (DE), Esther Scheven (DE), Traugott Koch (DE), Marcia Zeng (DE), Sylvie Dalbin (FR), Bernard Vatant (FR, ontologie), Leonard Will (UK), Douglas Tudhope (UK), Daniel Kless (ontologie), Marcia Zeng (US).
- Groupe français - travail sur cette partie 2 en petit comité au sein du Groupe français de l'Afnor (aujourd'hui ce groupe Afnor GE10 est clôt) : Hélène Zysman, Hélène Rabaud, François Feyler, Nathalie Yakovleff, Thierry Guillotin.
Le projet de norme à travers sa table des matières
Remarques :
- Cette table des matières correspond à la seule version en ma possession d'octobre 2011 avant que ce document ne soit transmis aux "autorités ISO". Je n'ai pas la version officiel diffusé sur le site (Selon les principes de cette institution, les auteurs n'ont pas de version officielle de leur travaux - ils doivent l'acheter - ce que je n'ai pas fait).
- J'ai laissé l'indication de la pagination ce qui vous donne une idée de l'ampleur de chacun des chapitres.
- Les textes sont parfois des traductions de paragraphes du document d'octobre 2011, mais tous sont retravaillés et ne peuvent être considérés comme la traduction du document de projet.
Content Page
1 Scope
2 Normative references
3 Definitions Terms and Definition
4 Symbols, abbreviations and other conventions
5 Objectives and identification
6 Structural models for mapping across vocabularies
7 Types of mapping
8 Equivalence mappings
9 Hierarchical mappings
10 Associative mappings
11 Exact, inexact and partial equivalence
12 Use of mappings in information retrieval
13 Handling pre-coordination
14 Techniques for identifying candidate mappings
15 Managing the data
16 Display of mapped vocabularies
17 Classification schemes
18 Classification schemes used for records management
19 Taxonomies
20 Subject heading schemes
21 Ontologies
22 Terminologies
23 Name authority lists
24 Synonym rings
Annex A (informative) - Management of terminological data in support of interoperability
Bibliography
Quelques commentaires ______________________________________________________________________
Content Page
1 Scope 1
[extrait] La capacité à identifier et à repérer l'information pertinente au sein de vastes collections de ressources est aujourd'hui un défi majeur et urgent. L'interopérabilité sémantique est dans ce contexte, une nécessité. Pour appuyer cette exigence, une grande variété de services Web et d'autres outils sont en cours de développement, y compris (mais non limité à) aux registres et aux réservoirs de vocabulaires et de schémas de métadonnées ou à des services de correspondance entre vocabulaires. La présente Norme internationale fournit des recommandations fondamentales pour la création de services et produits de correspondance entre schémas et vocabulaires.
Les fondements de ces travaux sur l'interopérabilité sont exposés dans la Partie 1 de la norme ISO 25964 sur les thésaurus. Malheureusement pour les autres types de vocabulaires susceptibles d'être mis en correspondance avec les thésaurus, il n'existe pas de normes équivalentes. C'est pour cette raison que cette partie 2 de l'ISO 25964 fournit une description élémentaire de ces autres vocabulaires avant de formuler des recommandations sur l'interopérabilité entre ces derniers et les thésaurus. Il ne donne pas d'indications sur la construction des vocabulaires eux-mêmes.
Les chapitres 1 à 12 traitent des principes et des aspects pratiques de l'interopérabilité, en particulier la mise en correspondance entre vocabulaires ou éléments d'un vocabulaire qui s'appliquent à tout vocabulaire, et en particulier aux thésaurus. Le chapitre 13 fournit des indications supplémentaires pour le traitement de classes pré-coordonnées que l'on trouve dans les schémas de classifications ou dans d'autres vocabulaires s'appuyant sur des principes classificatoires.
Les chapitres 17 à 24 sont dédiés chacun à un type différent de vocabulaire, en particulier ceux dédiés aux systèmes d'indexation et de recherche de ressources documentaires comme les systèmes de classification (y compris ceux utilisés pour la gestion des dossiers d'activités ou records management), les taxonomies, les schémas de vedettes matières et les listes d'autorité de noms. Malgré leurs objectifs différents, sont également intégrés d'autres types d'outils sémantiques que sont les terminologies, les ontologies et les réseaux de synonymes.
Chaque chapitre donne une brève description informative des caractéristiques-clés du vocabulaire ainsi que des éléments de comparaison de ses composants sémantiques avec ceux d'un thésaurus. Ces premières sections donnent le contexte dans lequel s'inscrivent les contraintes d'interopérabilité et les recommandations proposées dans les sections suivantes de chaque chapitre.
2 Normative references 1
3 Definitions 1
Cette section intègre la terminologie de la Partie 1 de la norme, fournissant en tout une centaine de définitions.
4 Symbols, abbreviations and other conventions 16
Des codes sont proposés pour identifier :
- les relations de mise en correspondance : EQ (equivalence), BM (broader mapping), NM (narrower mapping) et RM (related mapping),
- = (exact) et ~ (inexact) peut être associé à tout type de relation
5 Objectives and identification 17
Un "vocabulaire" est un schéma de concepts
5.1 Objectives of interoperability and mapping 17
5.2 Identifying the elements to be mapped 17
Quel que soit le type de vocabulaire, ce travail de mise en correspondance vise à montrer les relations entre les concepts propres à chacun des vocabulaires. Chaque vocabulaire a un terme consacré pour ces concepts – classe dans un schéma de classification, catégorie pour les taxonomies, termes pour les thésaurus,....
6 Structural models for mapping across vocabularies 18
6.1 General 18
La norme expose trois modèles généraux (6.2, 6.3, 6.4) et un modèle alternatif (6.5). Ces modèles ne s'excluent pas et peuvent être combinés.
6.2 Model 1: Structural unity 18
Dans ce modèle « Unité structurale », tous les vocabulaires participants partagent exactement la même structure de relations hiérarchiques et associatives entre concepts.
Les vocabulaires peuvent ne pas avoir exactement la même couverture thématique, mais pour les thèmes et concepts présents il y a unité structurelle.
6.3 Model 2: Direct-linked 18
6.4 Model 3: Hub structure 19
6.5 Selective mapping 21
Sont exposés deux cas : un recouvrement partiel entre deux vocabulaires est partiel (seul un champ sémantique ou un thème d'un vocabulaire est traité) et l'interopérabilité entre les index d'une base documentaire et un vocabulaire (et non deux vocabulaires).
6.6 Choosing between the options 22
Ces modèles structurels sont présentés séparément, mais dans des applications concrètes, on a plus souvent des combinaisons entre ces modèles. Ce point doit être clarifié au début des projets avec une attention particulière au sens (direction) des correspondances.
7 Types of mapping 23
De nombreux exemples (compréhensibles en français) émaillent chacun de ces chapitres..
7.1 General 23
8 Equivalence mappings 23
8.1 General 23
8.2 Simple equivalence 23
8.3 Compound equivalence 24
8.3.1 General 24
8.3.2 Intersecting compound equivalence (EQ + ) 25
8.3.3 Cumulative compound equivalence (EQ | ) 26
8.3.4 Compound equivalence involving a combination of target vocabularies 27
9 Hierarchical mappings 27
10 Associative mappings 28
11 Exact, inexact and partial equivalence 28
11.1 General 28
11.2 Exact equivalence 29
11.3 Inexact equivalence 29
11.4 Partial equivalence 30
12 Use of mappings in information retrieval 30
12.1 Introduction 30
Chapitre très bref qui se résume à dire que la mise en correspondance peut être réalisée : au moment de l'indexation ou au moment de la recherche elle-même.
12.2 Human mediation 31
12.3 Examples of mapping implementation 31
Dans l'approche la plus simple d'un travail de mise en correspondance, l'objectif vise seulement à identifier des paires de concepts dans différents vocabulaires. Toutefois, la précision et le rappel dans des applications de recherche documentaire peuvent être grandement améliorés si les correspondances sont différenciées (voir chapitres 7 à 10) et si les degrés d'équivalence sont marqués comme recommandés dans le chapitre 11. Pour illustrer la puissance de la différenciation des alignements, le tableau 4 présenté dans ce chapitre 12.3. montre différents exemples pratiques. Pour simplifier l'exposé, on suppose que dans tous les cas des thésaurus sont impliqués dans le processus. (voir aussi le chapitre 13).
Ce tableau 4 introduit un exemple pour chacun des principaux types de correspondance décrites dans les chapitres 7 à 11. Le tableau présente les caractéristiques des processus de correspondance appliqués à des index ou des vocabulaires.
12.4 Conclusions and recommendations 33
13 Handling pre-coordination 34
Ce chapitre présente des exemples plus complexes liés au traitement de la précoordination.
13.1 Introduction 34
13.2 Mapping between a thesaurus and a scheme with context-dependent captions 35
13.2.1 General 35
13.2.2 Mappings for conversion of indexing/cataloguing entries when the thesaurus is the target vocabulary 36
13.2.3 Mappings for conversion of search expressions when the thesaurus is the target vocabulary 37
13.2.4 Mappings for conversion of indexing/cataloguing entries when the thesaurus is the source vocabulary 38
13.2.5 Mappings for conversion of search expressions when the thesaurus is the source vocabulary 38
13.3 Mapping more complex classes 40
14 Techniques for identifying candidate mappings 41
14.1 General procedure 41
14.2 Computer assisted direct matching 43
14.3 Co-occurrence mapping 44
14.4 Other methods 44
15 Managing the data 44
15.1 Types of data to be recorded 44
15.1.1 Overview 44
Les données produites au cours d'un processus de mise en correspondance de concepts peuvent être enregistrées et gérées dans le temps selon trois niveaux :
- la correspondance entre concepts pris individuellement,
- la correspondance entre groupes de concepts entre tout ou partie de deux vocabulaires contrôlés,
- et enfin un ensemble coordonné de correspondances entre plus de deux vocabulaires contrôlés (par exemple, l'ensemble des correspondances entre un vocabulaire pivot et trois autres vocabulaires).
Ce chapitre fournit des recommandations sur ce qui doit être décrit et tracé dans le temps (maintenance).
15.1.2 For mappings between individual concepts 45
15.1.3 For a set of mappings between groups of concepts 45
15.1.4 For mapping clusters 46
15.2 Storing the data 46
15.2.1 Organizational aspects 46
15.2.2 Technical aspects 46
15.3 Maintaining the mappings data 47
15.3.1 General 47
15.3.2 Changes in the source or target vocabularies 47
15.3.3 Other mapping changes 48
15.3.4 The impact of mapping changes 48
16 Display of mapped vocabularies 49
16.1 General 49
16.2 Single record display 50
16.3 Complete displays based on one of the vocabularies 52
16.3.1 Alphabetical displays 52
16.3.2 Systematic displays 53
16.4 Crosswalks 53
Les chapitres 17 à 22 exposent les spécificités liés aux différents types de « vocabulaires » considérés dans un processus de mise en correspondance. Chaque chapitre suit la même structure, seule la section sur la typologie est spécifique à chacun des vocabulaires.
Le groupe de travail a jugé préférable d'adopter une approche pédagogique en prenant appui sur une typologie de « vocabulaires » existantes dans les différents terrains professionnels, plutôt que de proposer une typologie certes adaptée aux réalités techniques et sémantiques actuelles et plus cohérente sur le plan théorique, mais qui risquait de freiner l'expansion de ces recommandations.
17 Classification schemes 54
17.1 Key characteristics and background 54
17.1.1 General description 54
17.1.2 Scope and role in information retrieval 55
17.1.3 Origin and development 55
17.1.4 Vocabulary control 55
17.1.5 Types of classification schemes 55
17.2 Semantic components and relationships compared with thesaurus components 57
17.2.1 Notation 57
17.2.2 Captions 57
17.2.3 Hierarchies in classification schemes 58
17.2.4 Alphabetical indexes to classification schemes 58
17.3 Recommendations for mapping between a thesaurus and a classification scheme 59
18 Classification schemes used for records management 60
19 Taxonomies 63
« Les taxonomies prises en compte ici sont des vocabulaires hiérarchiques utilisés pour classer ou catégoriser, organiser, naviguer, naviguer, rechercher et / ou filtrer tout type de contenu dans les environnements en réseau. Un cas commun d'utilisation est l'exploitation d'une taxonomie pour la navigation […] à travers un large éventail de ressources électroniques, par exemple, sites Web, intranets, portails, wikis. ».
20 Subject heading schemes 71
21 Ontologies 76
Remarque - Je suis assez contente de ce chapitre. Dommage qu'il soit "enfermé" dans une norme ISO !
22 Terminologies 83
Ce chapitre a été contrôlé et enrichi par Sue Ellen Wright , responsable du TC 37, SC 3.
En annexe (informative) de ce document en projet, nous avons établi un tableau comparatif des modèles de données entre le format de la norme ISO 25964-1 (Thésaurus) et ISO ISO 30042 (format TBX des terminologues).
23 Name authority lists 86
24 Synonym rings 92
Les commentaires récents