19 août 2005

Thésaurus et Web Sémantique : le vocabulaire RDF SKOS


Présentation synthétique de SKOS, vocabulaire RDF pour l’encodage de schémas de concepts simples, tels que les thésaurus ou les plans de classement, prenant en compte les nouvelles versions du Guide et du Vocabulaire de base, d'octobre 2005.

Création :  19 Août 2005 - Mise à jour : 9 Octobre 2005
Voir aussi la note du 16/09/2005, mise à jour le 09/10/05 : Quelques caractéristiques du schéma RDF SKOS


SKOS (Simple Knowledge Organisation System) est un vocabulaire RDF développé sous l’égide du W3C, permettant de définir selon le formalisme RDF, des systèmes d'organisation simple de la connaissance (classifications, thésaurus….).

Les langages formels comme OWL, utilisés pour la conception d'ontologie dans le cadre du Web sémantique, ont parfois une logique formelle trop stricte et rendent difficile la prise en compte par exemple de la langue naturelle et des usages. C'est dans ce contexte que SKOS a été proposé ; il permet entre autre de prendre en compte le fait qu'un même concept peut avoir plusieurs appellations et qu'une appellation peut être préférée à d'autres, toutes choses bien connues des spécialistes des langages documentaires contrôlés.

Avec SKOS, nous entrons dans le monde du Web sémantique et de son formalisme.

Lire la suite "Thésaurus et Web Sémantique : le vocabulaire RDF SKOS" »

Le Web sémantique : quelques notions de base

Evoquant les thésaurus, on arrive immanquablement au Web sémantique.

Prenons un peu de temps pour dégrossir ce sujet avant de plonger dans les développement du Web qui concerne directement les vocabulaires contrôlés, tels les thésaurus, classifications et autres : le projet SKOS.

Mais qu'est-ce-que le Web sémantique ?
Une nouvelle méthode de management ? une technologie ?
Je dirais plus volontiers : un projet d'avenir, dont les propositions peuvent être exploitées comme cadre de développement de projets conduits aujourd'hui. Lorsque le projet porte sur des vocabulaires contrôlés d'accès à l'information, le Web sémantique oblige à plus de rigueur en particulier dans la sélection des concepts, des termes et des relations. Ce qui ne fait jamais de mal.

Si l'intérêt du Web sémantique dans le monde des langages est intéressant, cela nous oblige à faire un détour par le vocabulaire de ce domaine. Nous allons donc aborder URI, RDF, XML, PURL...

Lire la suite "Le Web sémantique : quelques notions de base" »

18 août 2005

Vocabulaires documentaires contrôlés et thésaurus

Nous nous intéressons, sur ce site, aux vocabulaires documentaires et plus particulièrement aux thésaurus.

Cela mérite quelques petites précisions …

  • un vocabulaire est constitué d’un ensemble de termes définis au sein / pour un groupe, une communauté de pratique, une organisation…, pour un usage et un contexte précis.
  • Ce vocabulaire est documentaire : c’est un outil de représentation et d’accès à l’information. Un vocabulaire documentaire n’est pas destiné à fournir des définitions ou des synonymes linguistiques (c’est le rôle d’un dictionnaire ou d’un glossaire). Selon la famille de vocabulaires documentaires utilisés (lexique, plan de classement, taxonomie ou thésaurus), les modes d’accès proposés à l’utilisateur diffèrent.
  • Il est dit contrôlé car chacun des termes choisis couvre un sens précis, univoque qui doit être utilisé pour un usage particulier. Ces vocabulaires sont utilisés pour contrôler la description des objets documentaires en amont, et l’accès à l’information en aval, même si pour ce dernier cas, il existe des moyens pour rendre transparent l’usage de thésaurus aux différents profils d’utilisateurs,
  • Le thésaurus que nous appellerons thésaurus documentaire est un vocabulaire, outil d’accès à l’information, offrant deux caractéristiques particulières : les termes sont utilisables en coordination entre eux au moment de la requête ;  ces termes sont liés entre eux par différents types de relations offrant ainsi un maillage utilisable à l’indexation et à la recherche.

10 août 2005

Liste de documents à caractère normatif


Liste des normes ou documents normatifs, quels que soient leur état et leurs origines, concernant les thésaurus, plus globalement les vocabulaires contrôlés et les index.
Création : le 18 août 2005
Mise à jour : 20 Novembre 2005 ; 15 Avril 2006 ; 10 Novembre 2007


  • Normes françaises Afnor
  • Normes anglaises BSI
  • Normes américaines ANSI/NISO
  • Normes internationales
  • Autres origines (W3C par exemple)

> Normes françaises

Thésaurus

Z47-100:1981 (décembre)
Documentation - Principes directeurs pour l'établissement des thésaurus monolingues
CN357   

Z47-101:1990 (décembre)
Documentation - Principes directeurs pour l'établissement des thésaurus multilingues
CN357

Z47-103:1980 (avril)
Documentation - Thésaurus monolingues et multilingues - Symbolisation des relations

Autres

Normes AFNOR
Z47-200:1985 (mars)
Documentation - Liste d'autorité de matières; Structure et règles d'emploi

Z44-070:1986 (août)
Indexation analytique par matière

Z47-102:1993 (octobre)
Information et Documentation - Principes généraux pour l'indexation des documents

Achat en ligne sur la boutique de l'Afnor

> Normes anglaises BSI

BS 8723 « Structured vocabularies for information retrieval
BS 8723-1:2005 Structured vocabularies for information retrieval.Guide  - Part 1: Definitions, symbols and abbreviations
BS 8723-2:2005  Structured vocabularies for information retrieval. Guide  – Part 2 : Thesauri
En cours d'édition :
BS 8723-3:2007 Structured vocabularies for information retrieval – Part 3 : Vocabularies other than thesauri (Schémas de classification, Schémas de classification d’activités pour le RM, Taxonomies, Schémas de vedettes-matières, Ontologies (uniquement la partie vocabulaire), Listes d’autorité)
BS 8723-4 :2007 Structured vocabularies for information retrieval – Part 4 : Interoperability between vocabularies
BS 8723-5  (en attente) Structured vocabularies for information retrieval – Part 5 : Exchange formats and protocols for interoperability.


> Normes américaines ANSI/NISO

ANSI/NISO Z39.19-2005
[Principes directeurs pour la construction, le format et la maintenance de vocabulaires contrôlés monolingues - en anglais] / Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies
Cette nouvelle norme, qui comme SKOS étend le champ de la norme à d’autres vocabulaires contrôlés que le thésaurus, a été approuvée mi-2005
Publiée en octobre 2005 > http://www.niso.org/standards/resources/Z39-19-2005.pdf#

Remplace : ANSI/NISO Z39.19-2003 Rev2
[Principes directeurs pour la construction, le format (présentation) et la maintenance de thésaurus monolingues - en anglais] / Guidelines for the Construction, Format, and Management of Monolingual Thesauri. (remplacé par ANSI/NISO Z39.19-2005, dont le titre est modifié)

NISO TR-02-1997
Guidelines for Indexes and Related Information Retrieval Devices, 1er janvier 1997.
Norme toujours à l'étude élargissant le champ de la norme ISO de 1996.
http://www.techstreet.com/cgi-bin/detail?product_id=52642


> Normes internationales

Thésaurus

NP 25964 - Projet de révision des normes internationales acceptée en juillet 2007 et suivi par ISO TC46 SC9 :  http://www.collectionscanada.ca/iso/tc46sc9/

ISO 2788:1986 (2ème éd., révision technique)
Documentation - Principes directeurs pour l'établissement et le développement de thésaurus monolingues    Documentation
Guidelines for the establishment and development of monolingual thesauri
http://www.collectionscanada.ca/iso/tc46sc9/standard/2788e.htm (table des matières de la norme)

ISO 5964:1985
Principes directeurs pour l'établissement et le développement de thésaurus multilingues (fév
Documentation -- Guidelines for the establishment and development of multilingual thesauri
TC46/ SC9 (CN 357)
http://www.collectionscanada.ca/iso/tc46sc9/standard/5964e.htm (table des matières de la norme)


Autres


ISO 5963:1985
Documentation - Méthodes pour l'analyse des documents, la détermination de leur contenu et la sélection des termes d'indexation / Documentation -- Methods for examining documents, determining their subjects, and selecting indexing terms
http://www.collectionscanada.ca/iso/tc46sc9/standard/5963e.htm (table des matières de la norme)

ISO 999:mai 1996
Information et documentation - Principes directeurs pour l'élaboration, la structure et la présentation des index / Information and documentation -- Guidelines for the content, organization and presentation of indexes
http://www.collectionscanada.ca/iso/tc46sc9/standard/999e.htm (table des matières de la norme)

ISO 5127:2001
Information et documentation - Vocabulaire (disponible en anglais seulement) / Documentation and information -- Vocabulary -- Part 1: Basic concepts ISO 5127-6 (1ère édition): 1983

Vocabulaire - Partie 6: Langages documentaires  (présente les concepts de base employés en information et en documentation pour décrire le langage documentaire, notamment les notes, les classifications et les thésaurus)   

> Autres origines

SKOS Guide Core 2005 (draft)
[Voir note Thésaurus et Web sémantique]

Propositions de l’IFLA, avril 2005
[Principes directeurs pour les thésaurus multilingues – en anglais] / Guidelines for multilingual thesauri (Working Group on Guidelines for Multilingual Thesauri
Propositions de compléments à la norme ISO 5964:1985
Page d’accueil du « Working Group on Multilingual Thesauri » de l’IFLA
Localisation du Guide : http://www.ifla.org/VII/s29/pubs/Draft-multilingualthesauri.pdf

Glossary of terms and definitions in International Standards, ISO/TC 46/SC 9, dernière mise à jour de 2002-04-02, en anglais avec équivalent français
http://www.collectionscanada.ca/iso/tc46sc9/standard/glossary.htm

Lire la suite "Liste de documents à caractère normatif" »

Dico Eng-Fre


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004