18 janvier 2008

Tagger pour la Library of Congress

Il y a un an (déjà !), je vous parlais des annotations d'un collectifs "normands" faites sur des photos de Normandie,...
[Des nouvelles du front ! 33 membres sur Flickr ont mis à jour 2977 légendes de ces photographies ; au 01 janvier 2008, 360 000 visualisations ont été effectuées]

Puis plus récemment, je vous parlais des Utilisateurs libérés du Musée McCord

Je poursuis ici avec ces pratiques d'annotations par les internautes avec le projet de la Library of Congress avec Flickr.

Et que font les internautes des photos proposées par la Library of Congress ? Analyse des traces laissées par les internautes sur une photographie du "classeur" 1930s-1940s (traduction française de Galerie ?)  ...

S'ENTHOUSIASMER
De très nombreux messages pour donner son sentiment sur les photos

SE SOUVENIR
Les natifs s'expriment  ; un afficionado/a de la photographie évoque son vieux Pentax]

APPRENDRE

Ici quelqu'un s'étonne de voir de la couleur pour une photo de 1913.
Quelqu'un d'autre lui signale avec amusement, qu'il s'agit de la date de naissance du photographe, la date de la photo étant 1943.... 

Voilà une leçon à la "maîtrise à l'information" qui profite à tous !  2 jours après, quelqu'un reconnaît qu'il s'était posé la question...

SE DOCUMENTER
D'autres posent des questions sur le photographe

STOCKER/CONSERVER
Plusieurs personnes ont conservé cette photo dans leurs favoris

ENRICHIR et ANNOTER
Quelqu'un d'autre rajoute un lien sur une biographie du photographe (qui se trouve sur un autre site US.
Quelques mots-clés ont été ajoutés, décrivant le paysage lui-même (blue sky, silo).

Il faut dire que tout comme pour le Musée McCord, la notice de la LC est assez sobre ;-) pour que l'on puisse sans problème envisager de l'enrichir.

Je vois aussi qu'il y a des francophones...

Et tout comme sur le portail de McCord, on peut annoter une portion de la photo] [passer la souris sur la photo]

Mais ne manquerait-il pas quelque chose : par exemple, un lien vers une carte pour nous dire exactement où c'est, parce que l'Etat de NY, c'est grand. Chose faite

QUE DIRE ?

Un fourmillement d'activités autour d'une photo, mise en ligne le 08 Janvier 2008 et déjà vue 6 814 fois !
Plus qu'un projet de redocumentarisation (je crois plus à l'organisation du projet "Normandie" pour cet objectif), c'est un réel projet d'animation et de valorisation du patrimoine !


Info repérée sur Nicomo

15 décembre 2007

Outils de recherche et de navigation : Montague Institute

Montague Institute est depuis 1992 une référence pour tout ce qui touche aux services d'information dans les Entreprises.

A la fois organisme de formation (pour les directions et les professionnels de l'infodoc), service d'information et de recherche sur les domaines des métadonnées et des taxonomies, Montague Institute propose depuis 1998, une "Knowledge base publishing" qui mélait (à l'époque) des données du web, des productions plus traditionnelles et des données issues de base de données.  Cette base éditoriale a évolué en 2003 vers un système éditorial plus complet intégré à leur dispositif de formation : naissait alors le Knowledge Base Editor's Digest, incorporant également des commentaires d'articles par des spécialistes,  toujours accompagné d'un index A-Z.

En 2005, Montague Institute décide d'outiller cette ressource, et de la partager avec une société que l'institut a initié et soutient : Society of Knowledge Base Publishers, créé en 1998 par l'institut dont les membres sont des entreprises ou organismes à but non lucratifs, des agences gouvernementales.... Cette nouvelle plateforme, Montague Information Technology (MontagueInfoTech),  est personnalisable pour les clients de l'institut et les membres de l'association (je n'ai pas pu le tester : je ne suis pas (encore) membre).

Sont ainsi accessibles : des textes issus de la foire-aux-questions (et réponses), les articles de leur revue ainsi qu'une sélection de pages du site web, des commentaires, des messages (sélectionnés) de la liste de diffusion, les programmes de formation... : il s'agit certes d'une base d'information et de documents. Mais l'outillage (index, thesaurus, références croisées) proposé optimise considérablement l'exploitation des informations au delà des documents.

Les cordonniers ne sont donc pas toujours les plus mal chaussés !

J'apprécie le fait que pour toutes les ressources, un minimum d'information reste accessible à tous publics, la plupart des articles de fond n'étant accessible dans leur totalité qu'aux abonnés, of course. Par exemple, cet article sur les 10 mythes des taxonomies (Ten Taxonomies Myths) de 2002.

Intéressant aussi de pouvoir étudier  un écran de leur système de gestion des référentiels.
Chaque "terme" a un identifiant avec des dates de création et de mise à jour clairement indiquée, ainsi que les documents qui lui sont assignés dans le système. il y a également des liens crées entre chaque terme et des termes voire des requêtes (External queries) externes. La norme étendue ....

Quelques précisions sur cette rubrique Index.

<Cliquez sur l'image pour l'agrandir>

Montagueinstituteterms

La rubrique Index propose :
- un index Société, un index Personne, une liste des Questions-Réponses,
- un index thématique sur 2 niveaux (Subjects)

<Cliquez sur l'image pour l'agrandir>

Montagueindexsujet

- associé à un thésaurus (définition, terme générique, spécifique, associés)

<Cliquez sur l'image pour l'agrandir>

Montaguethesaurus

et une recherche sur un index A-Z intégrant le tout.

<Cliquez sur l'image pour l'agrandir>

Montagueindexaz

 


29 juillet 2007

Thésaurus du réseau européen du patrimoine (HEREIN)

"système terminologique relatif aux politiques nationales [des différents pays de l'UE] concernant le patrimoine architectural et archéologique au sens défini par les Conventions de Grenade (octobre 1985) et de La Vallette (janvier 1992)"

Un thésaurus dédié exclusivement à la recherche au sein d'un corpus particulier de documents multilingues sur les politiques nationales des Pays de l'UE. Les documents ne sont pas indexés avec ce vocabulaire ; celui-ci sert exclusivement à interroger de façon transversale, les textes nationaux dans leur intégralité et dans chacune des langues.

Localisation

http://www.european-heritage.net/sdx/herein/thesaurus/consult.xsp
Consultable de façon autonome (indépendamment de l'interrogation d'une banque de données)

Site du Réseau européen du patrimoine :
http://www.european-heritage.net/sdx/herein/thesaurus/introduction.xsp

Editeur

Réseau européen du patrimoine
(système permanent d'information regroupant au sein du Conseil de l'Europe les services gouvernementaux européens responsables de la protection du patrimoine)
Correspondant en France : France Ministère de la Culture et de la Communication, Direction de l'Architecture et du Patrimoine

Mise à jour

Essentiellement sur les versions linguistiques, les définitions et les notes historiques

Quelques données chiffrées

Domaines thématiques : 9
Champs sémantiques : -
Descripteurs : environ 500 termes (dans chacune des langues)
Non-descripteurs : -
Relations - à compléter
Multilingue : 8 langues (allemand, anglais, bulgare, espagnol, français, hongrois, polonais, slovène)
A venir : 23 langues à terme

Facettes (Domaines)
1    Agents (organisations and people), Organismes et intervenants, Agentes (colectivos e individuales)
2    Heritage Category, Catégories de biens culturels, Tipos de bienes
       biens culturels, espaces, intérêt patrimonial, patrimoine   
3    Documentation, Systèmes de documentation, Documentacion
       documentation, inventaires, listes des biens protégés
4    Legal systems, Système légal, Sistema legal
       instruments légaux, Outils d'aménagement, gestion du patrimoine, propriété, délits
5    Interventions, Interventions, Intervenciones
       types d'intervention, politique d'intervention, programmes d'intervention, outils d'intervention
6    Professional training, skills and qualifications, Formation, métiers, compétences, Formacion y cualificacion
7    Access and Interpretation, Communication et sensibilisation, Comunicacion y sensibilizacion
8    Economic and Financial systems, Système économique et financier, Aspectos económico – financieros
9    Broad concepts, Concepts généraux, Conceptos generales
        Concepts généraux liés au patrimoine, par exemple archéologie.

Interface d'interrogation
http://www.european-heritage.net/sdx/herein/national_heritage/search.xsp?action=thesaurus

Herein

Voici la résultat d'une requête : "espaces boisés"
Requête : espaces boises (sites naturels sites tis sites peuplement sites arch ologiques prot secteurs sauvegard prot paysages urbains paysages culturels zones int historique zones arch ologiques lieux couverte ensembles arch ologiques parcs jardins ruraux sites arch ologiques sites parcs arch ologiques serves naturelles parcs naturels gionaux parcs naturels nationaux zones naturelles int cologique floristique faunistique zones protection patrimoine architectural urbain paysager emprises fonci res abords bois jardins historiques centres villes historiques champs bataille sites pave ensembles historiques sites patrimoine mondial sites prot ume ter letek obmo ja espacios areas gebieden podru ja obszary)
Langue(s) : N'importe quelle langue
Pays : N'importe quel pays

20 avril 2007

Ma Campagne Electorale ….

Nous parlons bien des candidats à la présidentielles 2007, mais il ne s'agit que d'une campagne de tests de leurs sites !

Ces sites, d'une durée de vie courte, ont déjà été étudiés sous plusieurs angles, et je vous renverrais donc vers d'autres blogues pour:

Mais ne trouvez-vous pas qu'il manque un billet sur …. l’organisation des sites sous l’angle de l’information et de la communication !

Je vous propose donc de regarder comment une des sources d'information centrale (le programme) est exposée sur les sites web des candidats, et ce qu’ils offrent aux citoyens-internautes pour s’informer et échanger.

Bien sûr, comme outil d’information et de communication, un site web dépend :
- des choix en termes de stratégie de communication : les spécialistes de la communication sont ici très présents et en filigrane on peut distinguer ceux qui ont compris que les dimensions "infodoc" ou "échanges avec les lecteurs » deviennent importants, ceux qui restent (toujours) ancrés sur le côté « brochure » bien léchée mais fermée, et ceux, très rares, qui sont devenus tri-encéphales : communication-documentation-webmestre.
- des moyens dégagés en matière de communication, et du niveau de "professionnalisme" qui a pu être mis en œuvre. Ceci est d’autant plus vrai pour un site d'une durée de vie très courte et/ou pour des candidats qui savent qu'ils ne seront pas défrayés (sous la barre des 5%).

Et comme tout système d’information, la conception et la construction du site vont dépendre pour partie du nombre d’utilisateurs potentiels, actifs ou au moins présents (un billet sur « DADVSI» sur le site bayrou a été commenté par 66 internautes mais il a été lu 16.944 fois), et bien sûr de la diversité et du volume des informations et documents que l’on souhaite rassembler et mettre à disposition.
Sur ce point, je me suis focalisée exclusivement sur le programme et les forums.

Méthode :
- Dépouillement des 12 sites et de leurs blogues compagnons entre les 09 et 10 avril 2007. A noter que le site de José Bové que j’avais analysé, n’existe plus (josebove2007.org); il est redirigé vers une autre adresse où je n’arrive pas à trouver le programme.
- Inscription sur quelques forums pour tester les fonctionnalités proposées (Bové, Bayrou, Royal, Sarkosy, Villiers) avec mon pseudo habituel Dalb et mon adresse électronique (SylvieATD@aol.com). Les forums sont ceux proposés par les candidats sur leur site ou leur blogue. Ce travail a été réalisé avec un souci d'honnêteté vis-à-vis des autres participants aux forums et des candidats.
D'ici peu je vais me désinscrire de la plupart de ces forums.

Je vous livre ici une synthèse de cette étude en trois parties :

1. Le site et la place du programme ou projet
2.
Le programme, un document numérique structuré accessible sur le site
3. Des outils à disposition des lecteurs

Bien sûr, il peut y avoir des erreurs ou oublis - non intentionnels, croyez-le bien.
N’hésitez pas à me les signaler.

Attention : les sites signalés dans ce billet seront quasiment fermés jusqu'à lundi 23 avril matin.

Lire la suite "Ma Campagne Electorale …." »

03 février 2007

Accès multisources avec SRU/W

Le projet de La Bibliothèque Européenne a démarré en 2001. Entre 2001 et 2003, les bases techniques sont alors posées, donnant une part importante au protocole SRU  (Search/Retrieve via URL). C'est de ce SRU dont il sera question ici 
(et non de la loi du même sigle mais pas du même nom -- Solidarité et au Renouvellement Urbains-- qui nous occupe beaucoup dans les soirées de Conseil de Quartiers.....).

1. Un protocole de recherche tout Web, riche, simple et libre !
2. Un peu de technique

3. Accès multi-sources simplifiés

4. La Bibliothèque Européenne, une application SRU

5. Mais quel vocabulaire utiliser dans un portail multisources ?

6. Et les portails documentaires ?


1. Un protocole de recherche tout Web, riche, simple et libre !

Tout Web..... Le protocole SRU permet de transmettre une requête dans une URL (d'où son nom), à l'instar des moteurs de recherche, direz-vous. Requête et réponses véhiculées dans une URL, nécessairement en XML, peuvent être envoyées sur le réseau sous différents protocoles de transfert : HTTP bien sûr, le plus simple, mais d'autres protocoles sont autorisés comme SOAP (ou POST) utilisés dans le contexte des Services Web, ces derniers ayant moins de restrictions, en particulier sur la longueur ou sur les jeux de caractères dans les messages transmis.

Riche.... Mais ici, grâce au langage de requête utilisé, CQL, SRU permet de formuler aussi bien des requêtes simples avec un ou plusieurs mots que des requêtes structurées plus complexes, pouvant utiliser des valeurs d'index récupérées par ce mécanisme. Bref, la qualité de z3950 et la simplicité de HTTP/URL. SRU et son compagnon pour les Services Web, SRW suivent donc le modèle fonctionnel z3950, tout en prenant appui pleinement sur l'infrastructure de l'Internet et du Web (les questions et les réponses sont en XML).

Simple... L'élément-clé de ce protocole est le langage de requête utilisé, CQL (Contextual Query Language ou langage de requête contextuel),  considéré comme plus lisible et plus intuitif que le langage de requête utilisé avec z3950 (pas très difficile de faire plus simple, diront certains...). Dans le projet TEL, c'est cette simplicité de mise en oeuvre d'un portail SRU comparé au montage à réaliser à partir d'un portail traditionnel, qui a orienté ce choix. 

Libre... Une autre qualité mise en avant par bons nombres de promoteurs : SRU est un protocole libre et l'OCLC propose un logiciel libre pour implémenter SRU/W pour s'interfacer avec des bases bibliographiques.

Alors SRU et CQL, XML, HTTP ou SOAP, associés bien sûr à OpenURL pour atteindre le document...voilà la quincaillerie pour les années à venir...

2. Un peu de technique

Le protocole ne se contente pas de spécifier l'opération "Search / Retrieve" (chercher puis récupérer), mais distingue précisément : Explain (le client demande préalablement au serveur de décrire les possibiliteś offertes) et  Scan (pour parcourir des entrées d’index)

Un petit bémol pour l'instant. Le procotole effectue côté client une transformation des données XML en (X)HTML via une feuille de style XSL(T) dynamiquement. Or les navigateurs n'offrent pas encore tous cette fonctionnalité. Des solutions alternatives, comme celle visible sur le schéma ci-dessous proposé pour la TEL intègre une passerelle intermédiaire dans l'architecture du système, pour prendre en charge cette transformation.

La version actuellement en usage (et en test) est la version 1.1. proposée le 13 Février 2004. La Version 1.2. est attendue. SRU s'accompagne de SRU pour les Services Web, SRW pour Search/Retrieve Web Service. D'où l'acronyme SRU/W (ou SRW/U).

3. Accès multi-sources simplifiés

Toutes ces qualités font de SRU/W un outil phare pour proposer des portails d'accès multisources.
Car même si les premières applications de part l'origine de leurs contributeurs, offraient un accès à des catalogues de bibliothèques via des serveurs z3950 à partir d'un client HTTP classique (navigateur), ce protocole a été envisagé immédiatement comme passerelle pour des archives OAI ou tout autre type de réservoirs.

4. La Bibliothèque Européenne, une application SRU

L'architecture proposée dans le projet TEL (The European Library), pour l'accès simultané aux catalogues des bibliothèques nationales, incluait une passerelle à des archives OAI-PHM dès 2004. Quant au prototype actuellement étudié toujours pour la TEL, il propose un accès simultané à Google Scholar ou Nature.

Schemasrutel2_2

Image_3_2

Portail SRU expérimental (pour TEL) : http://krait.kb.nl/coop/tel/SRUportal/

5. Mais quel vocabulaire utiliser dans un portail multisources ?

Interopérabilité entre réseaux, puis interopérabilité entre ressources (dépôts OAI, catalogues z3950, catalogues moins normalisés mais documentés comme GoogleScholar) : la recherche multisources (ou métasources) est alors "techniquement" possible.
Il reste tout de même à travailler sur l'interopérabilité entre les vocabulaires de ces sources.

Un exemple pour aider les Utilisateurs : Les auteurs du portail MyLibrary@Ockham ont conçu un prototype Client SRU qui exploite les ressources de l'archive de la  NDSL (National Science Digital Library ). Mais ils ont rajouté deux dictionnaires, de variantes orthographiques et de synonymes. Voilà ce que cela donne pour une recherche sur "chemical".  La réponse dans l'URL : http://mylibrary.ockham.org/sru-server.cgi?operation=searchRetrieve&version=1.1&x-database=master&query=chemical&maximumRecords=3&x-spell=1&x-thesarus=1&stylesheet=%2Fsimple%2Fstyle.xsl

C'est un début...

6. Et les portails documentaires ?

Comme toujours dans ces "paramétrages" informatiques, les choses peuvent être plus complexes qu'il n'y paraît, mais toutes les offres de portail centrées sur le principe des connecteurs pour des recherches fédérées devraient (à terme?) supporter le protocole SRU. 
Les produits d'origine ou fortement impliqués aux USA, s'en font l'écho comme Geac (V-Space) ou Primo d'ExLibris, mais les offres d'Archimed (Incipio) ou de GB Concept (Alexandrie v6) sont déjà là.

SRU/W : un protocole de recherche XML à suivre de près.

=====Portails et articles techniques, cités ou utilisés ====

Portail ressource

* Portail SRU expérimental (pour TEL) : http://krait.kb.nl/coop/tel/SRUportal/
* Portail de La Bibliothèque Européenne, http://www.theeuropeanlibrary.org/
* Portail officiel du SRU (Search and Retrieval via URL), http://www.loc.gov/standards/sru/
* British Library SRU Gateway Software (en) : http://herbie.bl.uk:9080/
* Le projet SRW/U open source de l'OCLC (en) : http://www.oclc.org/research/software/srw/
(proposition d'un logiciel en test pour implémenter SRW et SRU pour s'interfacer à des bases de données)

Articles techniques (ante-chrono)

* Un point sur les nouveaux protocoles de recherche d’information : SRU, OpenSearch/A9, CQL et Xquery , Sally H. McCallum (LC), IFLA 2006, Séoul (fr) (http://www.ifla.org/IV/ifla72/papers/102-McCallum_trans-fr.pdf)

* Serving Services in Web 2.0, Theo van Veen (NL), Ariadne Issue 47, 30-April-2006 (en),
(http://www.ariadne.ac.uk/issue47/vanveen/intro.html)

* Fourniture de notices du catalogue de la Bibliothèque du Congrès en format MARC/XML via les protocoles SRW/SRU et Z39.50, Mike Taylor (UK), Adam Dickmeiss (DK), IFLA, Septembre 2005 (fr), (http://www.ifla.org/IV/ifla71/papers/065f-Taylor_Dickmeiss.pdf)
[exposé des possibilités et difficultés de la passerelle SRW/U - z3950]

* Web services et bibliothèques, Figoblog, 9 novembre 2005 (fr). (http://www.figoblog.org/document1057.php)

* An Introduction to the Search/Retrieve URL Service (SRU), Eric Lease Morgan, Ariadne, issue 40, July 2004. (en), (http://www.ariadne.ac.uk/issue40/morgan/) + Site d'Eric Lease Morgan : www.infomotions.com/musings/sru/

* Metadata, Protocol, and Identifier Activities: Library of Congress IFLA/CDNL Alliance for Bibliographic Standards Report, IFLA 2004, Buenos Aires (en) (http://www.ifla.org/IV/ifla70/papers/024e-McCallum.pdf)

* Search and Retrieval in The European Library, A new approach, Theo van Veen (NL), Bill Oldroyd (UK), D-Lib Magazine, February 2004, Volume 10 Number 2. (en), (http://www.dlib.org/dlib/february04/vanveen/02vanveen.html)

* The European Library: Integrated access to the national libraries of Europe, Britta Woldering (DE), Ariadne, issue 38, January 2004 (en). http://www.ariadne.ac.uk/issue38/woldering/

* Les Bibliothèques nationales et l’accès à l’information (pdf) : le rôle de TEL et de MACS, Genevieve Clavel-Merrin (CH), IFLA, 1-9 August 2003, http://www.ifla.org/IV/ifla69/papers/028f_trans-Clavel-Merrin.pdf

Ajout (fin 2007)

* SRW/U with OAI. Expected and Unexpected Synergies, Robert Sanderson (UK), Jeffrey Young (OCLC), Ralph LeVan (OCLC), D-Lib Magazine, Volume 11 Number 2, february 2006, http://www.dlib.org/dlib/february05/sanderson/02sanderson.html

* Parallel Text Searching on a Beowulf Cluster using SRW, Ralph R. LeVan, Thomas B. Hickey, Jenny Toves (OCLC), D-Lib Magazine, Vol.11, n°9, September 2005, http://www.dlib.org/dlib/september05/levan/09levan.html
(utilisation du logiciel open source proposé par l'OCLC)

* Exploiting "Light-weight" Protocols and Open Source Tools to Implement Digital Library Collections and Services, Xiaorong Xiang, Eric Lease Morgan, D-Lib Magazine, October 2005, Volume 11 Number 10, http://www.dlib.org/dlib/october05/morgan/10morgan.html

* Search Web Services Document, nov. 2007 - Annonce d'une utilisation par OASIS de SRU (Organization for the Advancement of Structured Information Standards - www.oasis-open.org) http://www.crossref.org/CrossTech/2007/11/search_web_services_document.html

22 mai 2006

Nouvelle version de Zthes

En août 2005, nous présentions Zthes, le profil du protocole de recherche Z3950, permettant de naviguer et de sélectionner des termes au sein d’un thésaurus. La version 0.5 datait de 2001.
La version 1.0 vient de paraître avec comme principales modifications :

#  Ajout de nouveaux éléments  :
- termeUpdate [mis à jour], avec comme valeur : ajouté ou supprimé,
- termVocabulary, dans le cas où le thésaurus contiendrait plusieurs vocabulaires distincts (différent de termCategory)
- termCatégory : appartenance à un microthésaurus ou champs sémantiques, répétable
- termStatus avec comme valeur : actif, désactivé ou supprimé. En général, seuls les termes "actifs" sont utilisables en recherche
- termApproval avec comme valeurs : candidat, approuvé, rejeté. (On pourrait par exemple conserver les Candidats à la recherche). Distinct de termStatus
- termSortkey : une clé explicite pour chacun des termes.

# L'élément de donnée termNote est maintenant répétable, et peut avoir un label de désambiguisation (application, source, ...)

# en option, les relations peuvent avoir maintenant des poids reflétant l'importance de la relation entre termes

#  Il est possible de créer un enregistrement, thesNote, pour décrire l'ensemble du thésaurus  en utilisant les éléments du DC.

Les schémas valables sous la forme d'une DTD, W3C XML Schema ou Relax-NG Compact et Relax NG XML ont été mis à jour.

Les changements apportés en 2005 à la norme américaine ANSI Z39.19 sur les vocabulaires contrôlés doivent être pour beaucoup dans cette évolution.

Pour suivre les travaux et évènements de Zthes, la liste de diffusion : http://lists.indexdata.dk/cgi-bin/mailman/listinfo/zthes


19 août 2005

DeweyBrowser, interface de navigation basée sur la Dewey

Voilà un intéressant projet que cette interface proposée par l'OCLC à partir de la Dewey, DeweyBrower.

Dewey1_2

Sont proposés deux modes d’accès au catalogue :

  • une recherche par mots qui offre une présentation des résultats classés selon la Dewey
  • une navigation directe via la Dewey, avec une présentation progressive du 1er niveau au 3ème et dernier niveau proposé.

Trois niveaux de la Dewey, cela peut paraître peu, mais ces trois niveaux offrent une vision globale à l’écran.

Lire la suite "DeweyBrowser, interface de navigation basée sur la Dewey" »

Les notes récentes


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004