« septembre 2006 | Accueil | novembre 2006 »

29 octobre 2006

XML dans les traitements de texte

Cet article de Patrick Peccatte arrive à point nommé…
XML et les formats de traitement de texte et de mise en page, octobre 2006.

Dès 1994, certaines de nos interventions en entreprise visaient le développement des compétences des « auteurs de l'entreprise, aux « fonctions évoluées du traitement de texte et à la production de documents structurés » ; nous les initions alors « aux évolutions documentaires et plus particulièrement au concept de bibliothèque électronique ». Dans la foulée en 1996, se mettaient en place des modèles de documents (rapports, compte-rendus d'expérimentation, de réunion, points de décision...) pour assister les auteurs ou leurs assistant(e)s  à la production de documents avec l'objectif de mettre en cohérence cette production, et d’intégrer automatiquement ces éléments de données (on ne disait pas métadonnées à cette époque) dans des bases de gestion et recherche documentaires (objectif atteint).
Mais tout cela avec les moyens du bord : les macros et modèles des logiciels de traitement de texte, un ou deux scripts…Les outils SGML étaient réservés à l’édition, la grande Edition.

Puis XML, en 1998, est arrivé.

En 2002, XML a fait son entrée dans les traitements de texte avec ODF (Open Document Format) d'Open Office. ODF est depuis Mai 2006 une norme ISO. Quant au format de Microsoft, OpenXML, il sera présent dans la suite Office 2007. Nous voici donc en présence de deux formats faisant la même chose, mais en concurrence …
Parallèlement, des DTD ou des schémas « métiers » se sont créés, prenant une place importante dans certains environnement comme NewsML dans le milieu de la presse ou la TEI pour les textes électroniques dans le milieu universitaire. On peut également citer le projet ERELE, Etudes et Rapports Electroniques de l'Equipement du Ministère de l'Equipement.

Toutes ces questions assez techniques, sont difficiles à suivre.
C'est dans ce contexte que Patrick Peccatte de Soft Experience a conduit une étude pour l’Ifra dont les résultats seront diffusés sur CampusXML. Il nous livre ici une analyse, spécialisée mais de lecture facile, qui aborde à la fois l’évolution - hier, aujourd’hui et dans la conclusion, l’avenir proche - des caractéristiques XML des traitements de texte Word et OpenOffice ainsi que celles des logiciels de mise en page (InDesign et Xpress).
Ce travail est conduit suivant deux axes forts : 
- l’ouverture vers XML de ces produits : de l’export à partir d’un format tiers comme RTF des convertisseurs XML (niveau 1) jusqu'au format XML natif publié et standardisé (niveau 9 du tableau)
-  le degré de structuration XML..
Cet article (de 16 pages) est orienté édition et presse professionnelles, le secteur de prédilection de Mr Peccatte, mais si vous êtes concerné par les formats (structure) des documents numériques et leur développement, vous ne pouvez qu’être intéressé par cet article.

Autre ressource : Le Blogue Formats-Ouverts
ERELE > Harmonisation de la production, de la diffusion et de la conservation des Études et Rapports ÉLectroniques de l’Équipement (ÉRÉLÉ), du Ministère de l’Équipement, des Transports, du Logement, du Tourisme et de la Mer
- Le schéma directeur de l'administration électronique 2006-2010 Liste des initiatives,
- Plan d'action de l'Administration électronique (P2AE) 2004-2007, Actualisation 2005

26 octobre 2006

Une enquête sur les intranets (de grandes entreprises)

Jane McConnell, consultante spécialisée dans les statégies intranet, a conçu et conduit une étude sur les stratégies intranet dans les grandes entreprises entre juin et juillet 2006. ; informations sur son blogue

Voici une synthèse très orientée par mes centres d'intérêt. Le mieux est de lire le rapport que vous pouvez demander à Jane McConnell (64 pages en anglais)

Conduite entre juin et juillet 2006, cette (première) enquête offre une photographie de l'état de l'art des intranets.

Contexte de l'étude
40 questions aussi bien sur le budget ou l'évaluation que les aspects linguistiques ou juridiques, la gouvernance, la gestion, les applications, le futur ...
Répondants :  101 entreprises (très largement organismes privés) entre 5000 et 100 000 employés, 60% sur plus de 20 pays; 1/3 ont de 2 à 4 langues officielles. 58% des répondants sont européens. Les répondants viennent de la Communication (47%) ou de l'Informatique (19%).

- 21% des répondants disent que la moitié de leurs employés n'ont pas accès à l'Intranet.
Les cols blancs sont toujours épatés de ces chiffres, mais pensez donc aux unités de production type usines ...
- 23% un intranet ou portail intégré, 27% un intranet avec différentes sections, mais 42% pour des "famille d'intranets" avec plus ou moins de standardisation.

Quelques retours

- Initiés avec une finalité de communication pour "construire une culture commune", ces intranets manquent souvent d'applications intégrées (applications métiers ? si l'intranet ne va pas jusqu'aux unités de production...). Quant aux applications orientées clients (customer-facing functions), elles sont largement absentes. Ce qui constituerait un frein au déploiement de l'utilisation de ces intranets.

- les fonctions transactionnelles comme la gestion des planning ou la réservation de salle, des congés... sont présents ; les programmes de formation (59% des répondants) également.

- l'enquête montre une tendance à l'individuel : portail personnalisé, plus l'entrée des blogues et wikis... Même si les Pages d'Accueil sont encore largement les mêmes pour tous...
- les blogues ou wikis font donc leur entrée (timide). 21 répondants les utilisent pour plusieurs raisons dont : partager expériences ou connaissances (27%),  expertise (par les experts) sur un sujet (26%), diffusion d'actualités (15%) (le service après vente aux clients : 0 répondant !)

- malgré une forte proportion d'utilisation de statistiques (89 répondants) pour évaluer les intranets, le "retour informel des utilisateurs" reste le 2ème moyen pour évaluer et contrôler l'Intranet.... D'autres réponses (indicateur de satisfaction, enquête annuelle formelle...) montrent que ce point reste toujours très ambigue, et comme le dit Jane McConnell : "c'est un secteur qui exige plus de travail ..."

- 1/3 des répondants commencent à intégrer des profils de taxonomiste/architecte de l'information/expert en usabilité dans l'équipe de pilotage (quand celle-ci existe !)

- 84 (seulement ?) ont répondu aux questions portant sur les "flux d'information et contenu"
- doit-on se réjouir comme Jane que 32 répondants aient des taxonomies inter-entreprises et que cette tendance semble se développer. Car comme le dit Padawan :
"2) quand le vocabulaire autorisé est enfin validé, l'entreprise a déjà été restructurée deux fois et personne ne comprend un traître mot de la taxonomie officielle (à commencer par le mot taxonomie)" (Merci à Arkandis)
- quant aux flux, ils sont (toujours !) dirigés massivement du haut vers le bas ; les flux horizontaux ou du bas vers le haut étant très limités. (je pense que c'est une impression des répondants, je ne sais pas comment ce point est réellement estimé...)

Quelques initiatives pour les mois à venir : améliorer la navigation (58) + meilleure indexation pour améliorer la recherche (37) + installation d'un nouvel outil de recherche (33).

Une enquête à poursuivre...

Le 12 via le 018

Je fais suite à Abondance concernant l'annuaire (pages jaune/blanche électroniques)

Recherche
Abondance a pris comme exemple un nom "brezinski" offrant un lot résultat de 11 noms seulement. Mais prenez donc un nom plus fréquent....
Même avec le mien pourtant pas très fréquent, vous avez 22 pages soit 216 réponses (au dessus de 500, le système ne répond pas).
Vous voyez deux choses :
- des numéros de particuliers en "080" sont présents. Mais sans savoir pourquoi, toutes les séries de numéros ne s'y trouvent pas. Comparaison avec l'annuaire d'Orange / France Telecom qui affiche aussi ces mêmes informations : sur Orange j'ai retrouvé ceux de Free, mais pas tous !?. Ces mêmes numéros affichés dans Orange sont absents du 118012. Mystère.
- comme le dit Abondance, la recherche s'effectue sur toute la fiche descriptive : "toubib versaille paris" vous offre toutes les combinaisons Nom-Rue-Ville. Heureusement car en fonction des sources, le nom et le prénom sont inversés (attention donc à l'ordre alphabétique). Mais toujours le même problème de bruit et volume des réponses avec des noms fréquents. Rien que Charpentier Emile (pris tout à fait au hasard) vous avez 15 pages, soit 147 noms que vous devez regarder les unes après les autres car vous n'avez pas de filtres (région, département). En rajoutant 06 pour le département, j'ai 117 réponses, avec comme premier nom, quelqu'un qui habite sur Emile Charpentier, le lieutenant.

On vous propose toutefois une "Recherche à l'ancienne" !!! , c'est à dire avec Formulaire.
Et bien mon Emile Charpentier dans le 06 vous donne 7 réponses.

C'est comme dans les catalogues, mon coeur balance entre les 2 Formules de recherche.
Quant utiliser l'une ou l'autre interface... en fonction de quoi ? de la probabilité d'avoir un lot résultat volumineux. C'est dire qu'il faut déjà bien connaître le système !
Lorsque les résultats dépassent un certain volume difficile à traiter à la main (100 ?), le système pourrait vous proposer le formulaire prérempli avec ce qu'il a compris de votre question, histoire de stimuler l'utilisateur. Mais nous n'en sommes pas encore là...

Autres fonctions intéressantes

118012 propose aussi la liste des annuaires du monde par pays. Très pratique.

Enfin le service propose d'autres fonctions qui n'existe pas dans le service d'Orange, comme celle de rapatrier une fiche soit dans un espace personnel (il faut s'inscrire pour cela) , soit sous forme d'un fichier à décharger. les formats proposés sont Outlook, Lotus Notes, Lotus organiser ou Palm destop. Derrière le mot Outlook, se cache en fait le format VCard, normalisé et qui sert pour tous les logiciels !
Il faut le savoir.

Lire la suite "Le 12 via le 018" »

25 octobre 2006

Taxonomy Warehouse

En février 2006, nous nous posions la question du devenir de TaxonomyWarehouse, la base de références de vocabulaires contrôlés, après son rachat par Factiva.
Un an après ce rachat, on nous signale la mise à jour de la base et le changement de site. Sûr que le site, un peu vieillot a bien changé.
Concernant les fonctions de recherche, je me suis fait confirmé par Factiva, que tous les modes d’accès n’étaient pas encore totalement développés. Les modes "listes" ou "catégories" sont opérationnelles (titre, éditeur, catégories et un index complet), mais la recherche « libre » (!) ne porte pour l’instant que sur les mots des titres et non sur l’ensemble du descriptif du langage. De plus la recherche filtrée par langue n’est pas encore possible.
Cette annonce coincide avec la journée sur les taxonomies qui a lieu début novembre aux USA http://www.taxonomybootcamp.com/

Pour revenir à Taxonomy Warehouse, un petit rappel quantitatif/qualitatif : 650 vocabulaires contrôlés (550 seulement sur le site?), référencés dans 39 langues, en provenance de près de 260 éditeurs.
Il ne faut pas s’arrêter au terme employé – Taxonomie, car cette base couvre largement d’autres types de vocabulaires contrôlés.

Un formulaire est proposé pour faire enregistrer son vocabulaire ; et il est possible de passer par factiva pour commander son vocabulaire. Bon nombre de ces vocabulaires sont libres d’accès (la fiche signalétique proposant la localisation sur le Web), mais Factiva offre aussi le service d’acquisition de ces langages.

Les notes récentes


  • Infos&Contact

Compteur

Blog powered by TypePad
Membre depuis 11/2004