POPLINE est une banque de données bibliographiques sur la population, la santé de la reproduction et la planification familiale créée en 1970 (infos sur le site de l'Ined). C'est aussi le nom du thésaurus utilisé pour l'indexation du contenu des ressources documentaires spécialisées qui y sont référencées - aujourd'hui au nombre de 370 000.
Depuis 2001, POPLINE est maintenue dans le cadre du projet "Knowledge for Health" (K4Health) Project à l'Ecole de Santé publique Johns Hopkins Bloomberg (wikipedia), soutenu financièrement par l'USAID (Agence des États-Unis pour le développement international).
Ce dispositif vient de vivre une transformation importante : le thésaurus toujours consultable de façon autonome, est surtout valorisé à travers un nouveau mode d'accès dits par "sujets". Ces «sujets » correspondent à des requêtes préprogrammées, les fameux "profil de recherche" et services de DSI (diffusion sélective de l'information) auxquels peut s'abonner un utilisateur connecté.
Le mode de recherche "Subjects" se présente sous la forme d'une taxonomie d'environ 400 sujets spécialisés répartis et organisés au sein de 12 catégories principales. Ces sujets correspondent "simplement" à des requêtes préprogrammées élaborées à partir des descripteurs du thésaurus. Il suffit de regarder la forme de des URL dans lesquelles sont intégrées ces requêtes.
Note historique sur les DSI : une de mes premières activités dans le centre documentaire que j'intégrais il y a plus de 25 ans : concevoir et fabriquer des DSI (requêtes préprogrammées) sur un nouveau thème d'intérêt (les projets de recherche européens) au sein d'une liste organisée thématiquement d'environ 500 sujets. En 1984, Les lecteurs en s'abonnant recevaient mensuellement ou hebdomadairement sur papier, la liste de nouveaux documents sur le sujet. Aujourd'hui un simple fil RSS...et des possibilités offertes aux utilisateurs eux-mêmes de se composer leur propre fil.
Si vous utilisez ce mode de recherche (au lieu de formuler une requête directe ou via un formulaire "avancé"), et que vous récoltez toutes les ressources du fonds - ce qui peut faire beaucoup, l'interface offre quelques critères pour filtrer ces résultats : autres mots-clés des notices présentes dans le lot résultat, zones géographiques, années de diffusion et langues des documents.
Distinguer le type et genre documentaires qui curieusement se trouvent mélangés dans les mots-clés, aurait permis de faire la différence entre un rapport de 260 pages et un article de 7 pages.
J'ai toujours pensé qu'un thésaurus ne se montrait pas et ne devait pas être proposé à un utilisateur en recherche, surtout aux utilisateurs occasionnels. Cela fait longtemps que les logiciels offrent ces solutions de profils et requêtes préprogrammées, mais je souhaitais pointer ici d'une part le travail documentaire sur la taxonomie de sujets qui offre un réel espace de connaissances, et d'autre part l'ergonomie du site et de la rubrique..
Concernant le thésaurus
Il faut noter que le thésaurus Popline, qui regroupe plus de 2000 concepts, n'a jamais offert d'accès par grands domaines thématiques, mais seulement par ordre alphabétique et via une liste permutée. Il était donc vraiment difficile de naviguer dans cet espace. Un thésaurus d'ailleurs qui s'il suit bien les règles de structuration promues par les normes, ne suit pas du tout les conventions de codes puisque vous verrez des "BK", "NK" ou "RK" pour les "mots-clés" (Keywords) génériques, spécifiques et associatifs. Par contre dès 2004, faute de ressources, les versions francophone et espagnole du thésaurus ont été abandonnées ...
Et vous aurez noté que sans faire (pas encore ou pas massivement) du web sémantique, on peut notablement améliorer l'accès aux ressources.
Concernant les outils informatiques
Un rapide échange avec Debbie, la "Popline Manager". La banque de données est toujours produite et maintenue avec DB/Text d'InMagic (ils en sont très contents). Par contre, ils ont abandonné le produit Web Publisher d'InMagic, remplacé en Juillet 2012 par l'écosystème Drupal.
L'administrative utilise le formulaires de recherche avancée - associant deux API (Search API SoLR et FacetAPI) - pour construire les requêtes préprogrammées. A ma question sur les limites éventuelles, ils n'ont rencontrés pour le moment aucun problème particulier.
Ce que j'appelle une belle application sobre et efficace
- exploitant la richesse d'un existant (au lieu de tout jeter) pour créer de nouveaux modes d'accès
- dépassant les (vieilles) habitudes - distinguer "recherche" et "indexation", et donc séparer la production des données documentaires (sous DBText) et leur diffusion avec une autre famille d'outil plus adapté ;
- intégrant le facteur ergonomique.
Les commentaires récents