03 février 2007

Formation à distance pour les professionnels de l'infodoc

Vous avez suivi une formation professionnel en infodoc il y a déjà quelques années.
Vous estimez que les stages, c'est bien, mais pas suffisant. Et vous voulez vraiment vous remettre à flot !

Pour vous, l'ADBS et l'INTD ont concu une formation à distance sur 7 mois.
Une 2ème session est prévue début 2007.
Sur le site de l'ADBS

========================================================================================================
Les TIC dans les systèmes d'information documentaire
[formation tutorée à distance, équivalent 100 heures présentiel]
Organisée en partenariat par l’ADBS et l’INTD
====================================================
Nouvelle session 2007 : de mars à fin octobre 2007
====================================================
Site Web : http://www.adbs.fr/site/formations/detail_formation.php?id=155&version=1

Les TIC dans les SID
= Les Technologies de l’information et de la communication dans les Systèmes d'information documentaire (à distance)

L'ADBS et l'INTD ont conçu en collaboration une formation à distance, certifiante (certificat de spécialisation),
dont la 1ère session s’est déroulée courant 2006.

Public et pré-requis : Cette formation à distance s'adresse à des professionnels de l'information-documentation ayant été formés il y a plus de 5 ans (DUT, diplôme technique de l'INTD, licence professionnelle, maîtrise, DESS). Ces professionnels désirent se mettre à niveau dans le domaine des technologies de l'information et de la communication  indispensables aujourd'hui à la conception et à la gestion d'un système d'information documentaire. La formation permet aux participants d’acquérir les notions essentielles les plus récentes, techniques et méthodologiques, utiles pour mettre en place un système d´information documentaire exploitant ces technologies.

Contenu : La formation est construite autour d'une étude de cas. La réalisation de cette étude de cas prend appui sur trois modules thématiques fournissant des axes de travail précis sur (Module 1) les différents objets documentaires, leurs caractéristiques et les documents numériques, (Module 2) les technologies disponibles et leurs usages, et (Module 3) l'architecture d'un système d'information documentaire et la démarche de projet. Chacun des modules comporte, complémentairement à un cours général, des exercices et des fiches techniques sur des points précis (Exemple : document numérique structuré, fédération de contenu, portail documentaire, libre-propriétaire...)..

Organisation : Cette formation se déroule à distance sur 6 mois – sur un délai global de 7 mois. Elle est évaluée à un équivalent de 100h en présentiel (hors temps de travaux personnels). Elle s'appuie sur la plateforme de formation développée par le CNAM. Des points de rencontre téléphoniques jalonnent ce semestre de travail et un regroupement physique (non obligatoire) est prévu au 2/3 de la formation.  Une soutenance orale (obligatoire) est prévue en fin de formation devant un jury. La formation se conclut par la délivrance d'un certificat de spécialisation CNAM.
Le regroupement et la soutenance (réunions physiques) sont prévus sur Paris, ou dans un studio de cours CNAM avec une possibilité d'accès en ligne.
=============================================
Tarifs adhérents : 2000 €HT (2392 €TTC) - Tarif non adhérent : 3000 €HT (3588 €TTC)
Des informations vous seront communiquées ultérieurement sur les sessions à venir.
Contact :  formation@adbs.fr
Site Web : http://www.adbs.fr/site/formations/detail_formation.php?id=155&version=1
=============================================
Information mise à jour MAJ 15/01/2007

03 septembre 2006

Archives, Secrétariat, Bibliothèque, Documentation, Veille : Périple d'un utilisateur*

Toute ressemblance avec une situation existante serait fortuite,… mais envisageable et même en fait possible.

Chargé(e) d'étude, je travaille au service Environnement d'une collectivité. Je dois monter un dossier sur la question de la récupération des déchets électroniques (DEEE), en particulier sur le problème des ordinateurs et écrans que nos concitoyens jettent de plus en plus dans la rue !

  • L’approche « archives »

Vous êtes dans une collectivité : intéressant de voir ce qui s’est passé dans les temps plus anciens (20-30 ans), lors des projets de récupération du verre, pour profiter d’un retour d’expérience-terrain….
On obtient un (gros) paquet de documents de la même source (emetteur / activité). On sait d’où cela vient, mais on ne sait pas si ce que l’on recherche s’y trouve : peut être n’y a-t-il que des documents comptables ou administratifs…. En plus cela peut s’avérer très long de fouiller toutes ces boîtes sans index thématique. Encore heureux si l’on est autorisé à le faire ! Pour les études ou rapports, je devrais aller peut être au secrétariat du service … la secrétaire de l’époque est encore là…

  • L’approche « bibliothèque »

L’index de recherche proposé a de grosses mailles** ; il n’y a pas une étagère précise pour ce sujet, mais le/la bibliothécaire trouve assez facilement les ouvrages proposés dans son fonds. Certains un peu ancien peut-être, mais au moins là, on peut consulter tout de suite.
** Déchets et Administration ; pas très précis. On trouve Déchets métalliques ou Matières plastiques – Déchets, mais pas encore les déchets électroniques dans Rameau …. Pour des livres, cela devrait aller.

  • L’approche « documentation »

Tous les mots clés spécialisés sont utilisables pour trouver des informations techniques et même financières et sur les sociétés … Il faut prévoir du temps pour filtrer et classer le lot de documents-résultats par sources, types de documents, sous-thèmes…En plus, on me dit que je ne peux pas avoir tous les documents tout de suite. Et puis, il manque quelques photos ou vidéos de cas concrets pour étayer notre propos.

  • L’approche « veille et KM»

Ici, le classement avec un ou deux mots suffit (DEEE et collectivités). Le fonds est très peu volumineux, mais en revanche riche, précis et concret. Du contenu ! retours d’expérience, études comparatives avec des cas de pays étrangers, entreprises et organismes concernés …. Dommage que l’on n’ait pas accès à cette information, hautement réservée….
Quelqu'un du service me propose même un système d'évaluation du coût de la mise en place d'une filière de collecte, avec une "ontologie". Je ne comprends rien mais çela à l'air intéressant.

  • L’approche « Web »

Facile : mes mots clés, et une profusion d’information … tout azimut. Des documents déjà fournis par le trio « Bibliothèque/Documentation/Veille », au milieu de coups de pub de société. Mais des perles aussi dont une annonce de presse sur un congrès sur le sujet la semaine prochaine !

C'était sympathique cette petite ballade dans tous les services. J'y ai rencontré pas mal de collègues que je ne connaissais. Mais quel temps !

* Ce petit texte m’est venu après lecture du texte sur l’information muséographique proposé par le Getty (http://www.getty.edu/research/conducting_research/vocabularies/introvocabs/documentation.html)

30 avril 2006

Des thésauroglossaires en sciences de l'information

Commençons par le T-Rex - Terminosaurus Rex - Die Informationswissenschaft in Begriffen (Notions en science de l’information).
Proposé depuis 2000 par le département universitaire des sciences de l’information de l’université de Saarbrück en Allemagne (présentation en français et en anglais), un thésauro-glossaire en sciences de l’information enrichi par des liens vers des ressources bibliographiques en ligne sur le web ou non. Cette terminologie a été mise à jour en 2002, puis 2004.
Un thésaurus donc avec des relations : générique (Oberbegriff), spécifique (Unterbegriff), synonyme ou associative (verwandte). Une entrée par saisie directe, une navigation par plan de classement et un index des termes en anglais sont proposés.

Il est toujours intéressant de regarder l’organisation de cette classification, qui distingue langage d’indexation et langage de recherche.... Ainsi Thésaurus se trouve en Recherche d’information, et le terme « indexation basée sur thésaurus » (thesaurus based indexing = thesaurusbasierte Erschließung) est une méthode complémentaire d’indexation, la méthode centrale étant la méthode automatique….
La langue allemande nécessite des techniques capables de traiter chacune des parties composant les termes. Ainsi une recherche sur Indexierung propose : automatische und computergestützte,…Indexierung,… Intellektuelle Indexierung….mais aussi  Volltextindexierung.
Navigation et ergonomie performantes.

Dans le même genre, on peut citer :

- la « Terminologie de base en sciences de l'information » (2002),  bilingue français et anglais, proposé par l’EBSI, également présenté  sous forme de thésaurus;

- le Thésauroglossaire des langages documentaires : un outil de contrôle sémantique (2001), de Danièle Dégez et Dominique Ménillet, aux éditions de l’ADBS, malheureusement uniquement en version papier

- et le Vocabulaire de la documentation (2004)   coordonné par Arlette Boulogne, également aux éditions de l’ADBS, dont nous avons trouvé, tout à fait par hasard au cours de nos périgrinations webiennes, des traces électroniques sur le site de TV5.
Ainsi ce dictionnaire/traducteur conçu par Alexandria** de Mémodata intègre outre Wordnet, le dictionnaire informatisé très utilisé en TAL (traitement automatique des langues), ledit Vocabulaire de la documentation de l’ADBS. (attention à ne pas confondre ce dictionnaire/traducteur avec le Dictionnaire multifonction proposé également sur TV5).
Au hasard, l’exemple du terme « thésaurus » ! Mieux encore, le vocabulaire de l’ADBS proposant un index en 4 langues (fr, en, de, es), vous pouvez faire une recherche par exemple en allemand avec « Indexierung » …
Nous aurons l’occasion de revenir sur les outils comme Alexandria…et si vous êtes comme moi non germanophone, ce dico-traducteur vous aidera dans la visite du T-Rex entièrement en allemand !

En anglais, toujours d’actualité :

- Glossary of terms relating to thesauri and other forms of structured vocabulary for information retrieval, de Leonard Will,  (Revised 2006-04-21 (qui n'est pas un thésauroglossaire)

- Controlled Vocabularies: A Glosso-Thesaurus, Fred Leise, Karl Fast, Mike Steckel, 10/27/2003

Cette note sera complétée ultérieurement pour les ressources en espagnol... nombreuses...

09 octobre 2005

Sujets, concepts et classes : des distinctions fondamentales

Il existe trois grandes familles de vocabulaires contrôlés utilisés pour l'indexation et l'accès à l'information qu'il convient de bien distinguer : listes de sujets, thésaurus et plan de classification.

Nous proposons dans cette fiche synthétique de traiter, à partir de la notion de "sujet documentaire", des fondements de ces langages : les "sujets" d'une liste de sujets, les "concepts" d'un thésaurus et les "classes" d'un plan de classification....

Lire la suite "Sujets, concepts et classes : des distinctions fondamentales" »

21 septembre 2005

Thésaurus, un trésor !

Une simple recherche avec le mot thesaurus dans le Web francophone et anglophone ramène une pêche fructueuse et variée, devant laquelle les professionnels de l’infodoc restent parfois perplexes. Au milieu de thésaurus que nous nommerons documentaires, apparaissent d’autres « thésaurus » dont la fonction et/ou la structure ne peuvent être confondues avec celles des thésaurus documentaires.

Quelques exemples :

  • Dans le domaine médical : « l’ensemble des interactions médicamenteuses identifiées par le Groupe de Travail [Afssap] sont regroupées dans un Thesaurus […] « délivrant une information de référence » [http://agmed.sante.gouv.fr/htm/10/iam/triam.htm]. Le « Thésaurus de bonnes pratiques du cancer colorectal métastatique » répond aux mêmes besoins [www.snfge.asso.fr/01-Bibliotheque/0G-Thesaurus-cancerologie/TPC-cancer-dig/TPC.htm].
    On peut également citer le Thésaurus Vidal Semp (TVS), base de données médicamenteuse Rq : Ce produit a changé de dénomination. NDA]. L’aspect « contrôlé » ou univoque de ces listes rappelle les caractéristiques des vocabulaires documentaires, mais leurs fonctions pédagogiques ou ici normatives au cours d’un diagnostic ou d’une prescription, ainsi que leur structure s’éloignent fortement des normes qui régissent les thésaurus documentaires.
  • Dans le domaine juridique ou patrimonial : notons que le nom de domaine Thésaurus.fr a été pris par une société de conseil en développement patrimonial ; plus largement le terme thésaurus est exploité pour désigner des classifications ou des index de collections de textes à caractère juridique, voire des tables des matières détaillées d’un ouvrage (un code), point d'accès non combinatoire. Un exemple : le Thésaurus de la CNUDCI pour la Loi type sur l’arbitrage commercial international» [http://www.uncitral.org/uncitral/fr/case_law/thesauri.html].
  • Dans le domaine littéraire, le Thesaurus linguae graecae (TLG) de l’Université de Californie à Irvine correspond à une collection de textes littéraires connus de l'antiquité grecque [Online TLG - http://www.tlg.uci.edu/]. On peut également citer le Thesaurus Diplomaticus : « Base de données textuelles et d'images de 12.800 documents diplomatiques des VIIe au XIIIe siècles, portant sur l'histoire médiévale de la Belgique et des régions limitrophes [http://www.bib.ulb.ac.be/BSH/bsh_thes.htm]. Nous pouvons noter la fonction première de collection, groupement raisonné de ressources.
  • Dans le domaine linguistique ou plus précisément lexicographique, le thésaurus a un sens tout à la fois proche et distinct. En 1553, Robert Estienne (1503-1559) publiait le Thesaurus linguae latinae (TLL) dictionnaire bilingue ; son fils, Henri, publiait en 1572 le Thesaurus graecae linguae. L’évolution lexicographique française nous mène ensuite au Thresor de la langue françoyse de Jean Nicot en 1606 sans que la filiation avec les thésaurus documentaires soit visible, à une époque où l’orthographe et le dictionnaire se cherchaient (*, **). C’est avec l’ouvrage proposé en 1852 par l’anglais P.M. Roget, philosophe et savant, que cette filiation apparaît nettement. Le Roget’s Thesaurus of English Words and Phrases présente une liste de termes organisés non plus par ordre alphabétique, mais par sujets hiérarchisés (environ 1000 concepts en 6 niveaux). Ce thésaurus de langue est « sans prétention linguistique. « Notre tâche n’est pas d’expliquer la signification des mots [il n’y a pas de définition] mais seulement de les classer et de les arranger selon le sens que l’usage leur a donné et que nous supposons être connu du lecteur » (tiré de *, p.380). Plus avant dans l’Histoire, on peut noter des classements par centres d’intérêt : les mots sont alors en rapport avec le sujet évoqué. C’est l’origine des premiers vocabulaires médiévaux, souvent limités aux substantifs (*, p.362), l’idée sous-jacente étant "qu’une idée étant donnée, [il s’agit plus de] trouver le mot qui l’exprime le plus convenablement ». Alors que pour les dictionnaires, « un mot étant donné, [il s’agit de] trouver sa signification ou l’idée qu’il représente ».
    Avec le Roget’s Thesaurus, nous nous approchons fortement du monde des thésaurus documentaires. Mais les différences dans leur finalité (trouver un ou plusieurs "bons" mots pour connaitre et apprendre, ou pour interroger une base documentaire) entraînent des distinctions : sur le choix des mots (expansif dans le Roget incluant des phrases, restreint dans les thésaurus documentaires), et dans les outils d'orientation (générique et non modifié dans le Roget, adapté à la recherche dans un domaine pour les thésaurus documentaires).
    Toujours est-il que le Roget’s thésaurus est régulièrement cité dans les ouvrages lexicographiques (dictionnaire de langue), mais les thésaurus documentaires n'apparaissent pas parmi les outils lexicographiques ou très rarement dans le monde de la terminologie.
  • Enfin, le site www.thesaurus-tv.com, « magazine des chasses au trésor et des jeux de sagacité », nous ramène à l’étymologie du terme : le trésor !! Car derrière ces contextes d’utilisation multiples - thésaurus médical, littéraire, juridique, linguistique, documentaire…- c’est l’idée d’un trésor qui est pointée avec le choix de ce terme : trésor à préserver, à fructifier, à gérer, … à partager. Ce que la terminologie employée par Nicot en 1606 reprend dans le « trésor historique de la langue française ».

Ces exemples mettent en exergue quelques caractéristiques des thésaurus documentaires : l’aspect contrôlé (juridique, médical), de référence (médical, littéraire), l’organisation hiérarchisée des termes  (thesaurus linguistique), mais toutes les caractéristiques des thésaurus documentaires ne sont pas couvertes en particulier les plus spécifiques (relations et structure, type d'équivalences) sont peu visibles.

Plusieurs problèmes résultent de cette absence de distinction entre ces différents « thésaurus ».
En particulier les thésaurus documentaires, moins nombreux que les dictionnaires et d’un usage plus ciblé et plus contraignant, sont fréquemment perçus et utilisés par des non-professionnels de l’infodoc, comme de « simples » lexiques ; la présentation hiérarchique est souvent assimilée à la hiérarchie d’un plan de classement, le concept représenté pris pour un sujet et les relations ne sont ni comprises et donc non exploitées réduisant fortement l'intérêt de cet outil.

Pour le premier problème évoqué (un thésaurus est un dictionnaire) et en tenant compte de l’histoire qui donne la prérogative au dictionnaire lexicographique (Roget's Thesaurus, Thésaurus Larousse,...), il serait certainement sage de nommer les thésaurus utilisés pour l’indexation et l’accès à l’information, thésaurus documentaires ou thésaurus de descripteurs, comme le précisent Jacques Maniez (langage de descripteurs, p. 317-) et Michèle Hudon****.
La construction d’un nouveau terme moins ambigu pour ce nouvel outil aurait été plus judicieuse. Mais les initiateurs ne devaient pas s’imaginer l’extension de son usage et une telle reconnaissance près de 40 ans après !

-----------
Nous avons largement utilisé le Web pour la diversité des exemples cités.

Les dictionnaires et thésaurus de langue :
* Site Estienne-Nicot, Les dictionnaires de Robert Estienne et de Jean Nicot, T.R. Wooldridge, août 1998, http://www.chass.utoronto.ca/~wulfric/tiden/
** Le musée virtuel des dictionnaires [site], Jean PRUVOST, Université de Cergy-Pontoise - UFR de Lettres et Sciences humaines CNRS, INaLF, Métadif, http://www.u-cergy.fr/dictionnaires/index.html
*** Les Dictionnaires du français moderne. 1. Études sur leur histoire, leurs types et leurs méthodes, 1539-1863. Bernard Quemada. Paris, Bruxelles, Montréal : Didier, 1968

Les thésaurus documentaires
*** Le thésaurus : conception, élaboration, gestion, Asted, 1994, p.35

19 septembre 2005

Le mot-clé


Note sur la notion de mot-clé pour la recherche d'information.

Création : le 17 septembre 2005
Mise à jour : le 19 septembre 2005

A la question posée  « quelle(s) compétence(s) doit posséder un utilisateur ayant un besoin d’information et souhaitant formuler une question à un système documentaire", un collègue terrain annonçait durant un stage de formation de formateur auprès de bibliothécaires et documentalistes : «les utilisateurs du Centre en fait ne savent pas ce que veut dire mot-clé ».

Voilà une compétence rarement formulée et pourtant si essentielle !

Le sens attribué par les documentalistes se rapporte souvent à l’indexation des documents :

« Terme choisi généralement dans le titre ou le texte d'un document pour en caractériser le contenu et en permettre la recherche. Il constitue un point d’accès. Il est à distinguer d’un descripteur, qui est un terme normalisé dans un thésaurus. (Vocabulaire de la Documentation, ADBS Editions, 2004)

« Keyword : significant term found in a document, in its title or in an abstract, which identifies subject content » (in Concice dictionary of Library and Information Science, Stella Keenan, Bowker Saur, 1996)

Mais, formulée selon le point de vue de l’utilisateur dans une phase de recherche :
« C’est à partir des termes porteurs du sens requis (les mots clés) que la question est posée » (*, p.152)

Ce n’est donc pas seulement « taper quelques mots » !!

Mais comment faire pour choisir ce ou ces mots qui serviront de clé(s) ?
Comment éliminer les intrus ? (*)
Et comment faire pour acquérir cette compétence ?

Le Web et les moteurs de recherche ont modifié le contexte et les exigences de la recherche d’information, et si les méthodes à employer sont différentes de celles édictées dans les règles professionnelles (champs contrôlés d’une base de références bibliographiques), elles ne le sont qu’en partie seulement.

En effet, l’étape initiale qui consiste à réfléchir et identifier les mots-clés distinctifs par rapport à son besoin d’information, reste identique et normalement indépendante de la 2ème étape manipulatoire qui porte sur le choix définitif du ou des termes utilisés pour le système informatique.
Les précisions apportées dans un article de la Commission Français et Informatique** sur les difficultés liées à la 1ère étape en pédagogie et sur la notion de mot-clés, sont éloquentes et très intéressantes.

Quant à l’étape suivante de sélection des « bons » termes vis-à-vis du système, favoriser l’apprentissage des compétences nécessaires à un usage intelligent de chacun de ces dispositifs me semble plus efficace, plutôt que d’imposer à tout prix un modèle unique de recherche d’information : celui de la base bibliographique, comme semble le suggérer Marc Duval dans son article sur les mots clés***.

Entre autres, la compétence de fouille dans un lot résultat s'appuyant sur les outils de catégorisation proposés me semble tout aussi intéressante à acquérir, que la compétence de sélection d’un « bon » mot clé, ou (pire?) celles liées aux syntaxes et ergonomie variées pour formuler la question, mis en œuvre dans les systèmes documentaires informatisés.
Des compétences techniques, manipulatoires comme le suggère Mr Fondin dans son dernier article sur le sujet****, plutôt que des compétences liées à la signification (« le mot-clé concentre le sens »**)

Les pratiques liées aux outils du Web vont se développer ; l’Internet/Intranet mobilise d’importantes « masses et flux » d’usagers et d’usages. Aussi me semblerait-il plus judicieux que les professionnels de l’infodoc intègrent positivement dans les projets de formation mais aussi de conception des dispositifs documentaires, ces modèles ou des modèles dérivés, en faisant la promotion du mot-clé, indispensable dans les 2 modèles de recherche.

SD
-----
* L’analyse documentaire, Suzanne Waller, ADBS Editions, 1999
**  La notion de "mot-clé" et sa difficile application pédagogique, Commission Français et Informatique, [2000], http://users.skynet.be/ameurant/francinfo/motcle/motcle.html
*** Le mot-clé, Marc Duval, Dernière mise à jour 2002-01-08, http://www.dsi-info.ca/mot-cle.html
**** La formation à la recherche d’information : préoccupation citoyenne ou vision obsolète?, Hubert Fondin, Revue Esquisse, p.16-25, http://www.aquitaine.iufm.fr/recherche/esquisse/pdf/esquisse43.pdf

15 septembre 2005

Relation hiérarchique d'instance

Au sein des relations hiérarchiques, il est possible d'identifier les relations partitives et les relations d’instance.
Dès la norme ISO de 1986, la relation partitive est caractérisée et symbolisée par les trigrammes TGP (terme générique partitif) et TSP (terme spécifique partitif).
Par contre les relations hiérarchiques d’instance ne font leur apparition en tant que relation formelle, qu’avec la dernière norme américaine (Z39.19:2005, votée en juillet) et le draft de la norme anglaise BSI 8723 en cours de rédaction. Ces relations d’instance existent également dans le schéma RDF SKOS.
Elles sont alors symbolisées par les trigrammes TSI (terme spécifique d’instance)/TGI (terme générique d’instance).

Que sont ces relations d’instance ?
...« contrairement aux autres relations, elle [instance] ne lie pas des classes de concepts entre elles, mais un objet unique au nom de la classe »
(tiré de Cartes Conceptuelles et Thésaurus : Essai de Comparaison Entre Deux Modèles de Représentation Issus de Différentes Traditions Disciplinaires, Lalthoum Saadani et Suzanne Bertrand-Gastaldy, ACSI 2000, http://www.slis.ualberta.ca/cais2000/saadani.htm).

Jean Aitchison exprime cette relation par la notion d'exemple : « une catégorie générale de choses et d’évènements exprimée par un nom commun, et un exemple individuel de cette catégorie,...».
(tiré de Construire un thésaurus : manuel pratique / Jean Aitchison, Alan Gilchrist,  ADBS éd., cop. 1992, p.61)

C’est une relation hiérarchique qui relie donc deux entités suivant le critère « est un spécimen d’une catégorie » ou "est un exemple de".

Mais dès lors que ce type de relation est formalisé – d’instance mais ceci est valable pour les relations partitives-, il paraît nécessaire de les distinguer des relations hiérarchiques génériques.
Celles-ci sont alors symbolisées par le trigramme : TGG/TSG. Ce qui donne en anglais :
BT Broader Term - BTG Broader Term (generic ) - BTI Broader Term (instance)
NT Narrower  Term - NTG Narrower Term (generic ) - NTI Narrower Term (ins tance)

Des exemples
Exemple 1
La Mégane est un spécimen de la catégorie Voiture > Voiture TSI Mégane ; Mégane TGI voiture
Et une voiture est un type de véhicule terrestre: véhicule terrestre TG voiture ; voiture TS véhicule terrestre

Exemple 2
La Seine est un spécimen de fleuve : fleuve TSI Seine (Seine TGI fleuve)
Et un fleuve est une catégorie / type de cours d’eau : cours d’eau TG fleuve (fleuve TS cours d’eau)

Exemple 3
Belmondo Paul est un « spécimen » de la classe « acteur » relation d’instance
Et acteur est un spécifique de métier du spectacle, comme musicien ou comédien

Exemple 4
Poilane est une instance de Boulanger
Et boulanger et boucher sont des spécifiques de Commerce

Exemple 5
Mer baltique ou Mer caspienne sont des instances de Mer

Quel usage ?
On peut remarquer que ces relations lient fréquemment un nom propre (la Seine, Mégane, Belmondo) à une catégorie d’origine. On voit tout de suite l’intérêt de relier hiérarchiquement les entrées des listes de noms propres, mises en « annexe » des thésaurus aux termes des champs sémantiques, en lieu et place d’une relation associative ou d’une relation hiérarchique générique qui ne pouvait être assurée qu’avec des thésaurus polyhiérarchiques.

22 août 2005

Différents outils terminologiques

Dans la continuité de nos repères terminologiques sur le thésaurus, voici un panorama rapide des outils terminologiques et de leur composition : dictionnaire, glossaire, vocabulaire, lexique, nomenclature et thésaurus documentaire.

Lire la suite "Différents outils terminologiques" »

19 août 2005

Dictionnaire, terminologie et thésaurus : essai de comparaison

<p><p><p><p><p><p><p><p><p><p>Dictionnaire, terminologie et thésaurus : différences et similitudes</p></p></p></p></p></p></p></p></p></p>

Dictionnaire, terminologie et thésaurus : pour des non-spécialistes, la présence de ces trois familles d’outils semble superflue, ou plus exactement terminologie et thésaurus sont peu distingués d’un dictionnaire. Et pourtant chacune de ces familles a ses spécificités et ses règles d’élaboration et d’utilisation, même s’il existe des mix de certaines familles (thésauro-glossaire, thésaurus terminologique, dictionnaire-terminologique par exemple).

Même si les logiciels linguistiques proposent aujourd’hui de « charger facilement votre dictionnaire, thésaurus ou terminologie spécifique à votre entreprise » (http://www.lingway.com/fr/b3.htm), une bonne connaissance des spécificités, intérêts et limites des uns et des autres facilitera les évolutions à venir : autre version linguistique à partir d’un lexique existant, enrichissement terminologique d’un thésaurus, développement d’une interface de recherche en langage naturel…

Nous vous proposons dans ce cadre un tableau recensant quelques caractéristiques permettant de distinguer ces différentes familles d’outils.

 

Lire la suite "Dictionnaire, terminologie et thésaurus : essai de comparaison" »

Thésaurus et Web Sémantique : le vocabulaire RDF SKOS


Présentation synthétique de SKOS, vocabulaire RDF pour l’encodage de schémas de concepts simples, tels que les thésaurus ou les plans de classement, prenant en compte les nouvelles versions du Guide et du Vocabulaire de base, d'octobre 2005.

Création :  19 Août 2005 - Mise à jour : 9 Octobre 2005
Voir aussi la note du 16/09/2005, mise à jour le 09/10/05 : Quelques caractéristiques du schéma RDF SKOS


SKOS (Simple Knowledge Organisation System) est un vocabulaire RDF développé sous l’égide du W3C, permettant de définir selon le formalisme RDF, des systèmes d'organisation simple de la connaissance (classifications, thésaurus….).

Les langages formels comme OWL, utilisés pour la conception d'ontologie dans le cadre du Web sémantique, ont parfois une logique formelle trop stricte et rendent difficile la prise en compte par exemple de la langue naturelle et des usages. C'est dans ce contexte que SKOS a été proposé ; il permet entre autre de prendre en compte le fait qu'un même concept peut avoir plusieurs appellations et qu'une appellation peut être préférée à d'autres, toutes choses bien connues des spécialistes des langages documentaires contrôlés.

Avec SKOS, nous entrons dans le monde du Web sémantique et de son formalisme.

Lire la suite "Thésaurus et Web Sémantique : le vocabulaire RDF SKOS" »

Les notes récentes


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004