31.01.2006

Grille d'analyse 9 : l'International Children's Digital Library

Nom et référence

International Children's Digital Library

Types de documents

livres pour enfants

Tout public : le site est en anglais mais on peut régler la langue pour la présentation de la page de recherche.

URL

http://www.icdlbooks.org/books/index.html


Quantité/ taille du fonds

890 documents libres de droits, réparis en 34 langues.


Caractéristiques générales


Dates

de 1500 (un document) à aujourd'hui.

Modes de recherche

Très complet et très bien orienté pour la jeunesse

-la recherche simple est composée d'une ppage avec des boutons de choix selon 6 critères : l'âge de lecture, histoires vraies ou inventées, taille du livre, livre d'image ou non, les personnages intervenants dans l'histoire et la couleur de la couverture. On trouve en plus des boutons pour les contes de fées et contes folkloriques, les livres primés et les ajouts récents. La présentation des résultats se fait dans un cadre au milieu, qui réagit et se met à jour dès que l'on clique sur un bouton. Le bouton cliqué reste enfoncé et les boutons de la même catégorie se grisent, permettant de combiner les recherche, par exemple on peut chercher un livre pour les 10 ans et plus avec une couverture rouge et des personnages imaginaires.

-la recherche avancée permet de choisir les champs sur lesquels on va chercher parmi un choix plus large.

-un mode butinage est proposé, où l'on peut choisir de feuilleter le catalogue selon que le document est une mise en ligne récente ou a gagné un prix et selon les noms d'auteurs ou d'illustrateurs. On peut aussi afficher la liste de tous les ouvrages de la collection numérique.

-à noter, un mode de recherche géographique, où l'on clique sur une grande région du globe terrestre pour accéder aux documents.

 

Finesse et pertinence de l’indexation

L'indexation semble basique mais efficace. Le moteur de recherche trie bien les ouvrages et les résultats de recherche sont conformes à la demande.

Statut juridique des documents

Les documents sont tous libres de droits, que ce soit par l'ancienneté ou par la permission de l'auteur.


Caractéristiques Techniques

Nom du fichier

Les documents sont nommés par le début du nom de l'auteur, suivi du début du titre suivi de deux blocs de chiffres.

Nombre de pages/fichiers

jusqu'à tois cent pages pour les ouvrages les plus épais.

Taille de chaque fichier

cha que fichier image fait une centaine de Ko maximum.

Logiciels de visualisation

La lecture en ligne est la seule possible, sauf en récupérant les image dans les fichiers internet temporaires.

Est-ce une BDD unique ou distincte ?

Base de données distincte.

Métadonnées

Externes aux documents, mais on en trouve en interne aux documents tout ce qui concerne les détails techniques (taille, résolution,...).



Caractéristiques des documents

Couleur ou N/B

Couleur

Lisibilité

Numérisation de bonne qualité, même en mode image on peut trèq bien lire les caractères.

Impression et enregistrement possibles ?

Téléchargement et impressions non autorisés (clic droit désactivé) mais l'on peut récupérer les images qui sont dans le fichier temporaire.



Commentaire : une collection très adaptée à son public (c'est une des missions principales de l'ICDL) permettant une recherche intuitive pour les enfants. En effet ce sont des cirtères qui leur sont familiers qui ont été pris en compte pour la recherche, comme la couleur de la couverture du livre, qui est un éléments que les enfants retiendront facilement, contrairement par exemple au nom de l'auteur. On peut lire un livre en commençant du début comme on peut le feuilletter, et ceci toujours en pouvant à tout moment revenir vers la présentation de l'ouvrage, la recherche effectuée ou la liste des types de recherche. La représentation de nombreux pays et de nombreuses langues est très intéressant et permettra surement aux enfants de s'intéresser aux autres cultures.

Bibliographie

BELISLE, Claire, SALAUN Jean-Michel et VANDENDORPE Christian; Lire avec un livre électronique : un nouveau contrat de lecture; Les défis de la publication sur le web : hyperlectures, cybertextes et méta-éditions; ed. Enssib; Villeurbanne : Presses de l’enssib; 2004; 290 p


BLANCHARD, Martine; Les collections numérisées des bibliothèques municipales, de la réalisation à l’identification des ressources numériques; Site de la Bibliothèque de Lisieux; 2002 Disponible sur : http://www.bmlisieux.com/colloque/blanchco.htm


BOISCHEVALIER, Lauriane de; La doc en pleine dépression; Archimag; novembre 2005
Disponible sur
http://www.archimag.com


LE CROSNIER, Hervé; Moteurs de recherche et bibliothèques numériques; 2005
Disponible sur :
http://www.vecam.org/article.php3?id_article=461


FINGERHUT, Michel; Le futur de la bibliothèque, la bibliothèque du futur; Miklos; Novembre 2005.
Disponible sur :
http://mmdl.free.fr/blog-m/?p=248


GELINAS, Marie-Anne; Les compétences requises pour la diffusion d’une collection numérique. BN du Québec en ligne;2004; http://www.bnquebec.ca


GRADMANN, Stefan; Catalogage et métadonnées : du vin vieux dans des bouteilles neuves ?; Disponible sur les site : http://www.ifla.org/IV/ifla64/007-126f.htm


HIDOINE, Bernard, LE MOAL, Jean-Claude; Bibliothèques numériques; Cours INRIA, 9-13 octobre 2000; La Bresse, Paris; ADBS Editions; 2000; coll. Sciences de l'information; série Etudes et techniques.


JACQUESSON, Alain, RIVIER, Alexis; Bibliothèques et documents numériques,Concepts, composantes, techniques et enjeux; Paris; Electre-Editions du Cercle de la Librairie; 1999; coll. Bibliothèques.


NAWROCKY, François; Le protocole OAI et ses usages en bibliothèque; Disponible sur le site : http://www.culture.gouv.fr/culture/dll/OAI-PMH.htm

29.01.2006

fiche de lecture 9 : "Numériser en JPEG: un mauvais choix?"

Par l'archiviste de « souslapoussiere.org »

http://www.souslapoussiere.org/index.php/2006/01/22/8-num...

Cet article tiré de « sous la poussière.org », blog d'archivistique parle de la compression Jpeg appliquée à la numérisation de fonds patrimoniaux. L'auteur s'interroge sur la fiabilité du Jpeg, suite à deux comptes rendus de numérisation d'archives qu'il a lu.

Le problème, pour lui, est que la compression Jpeg génère trop de perte sur les caractères textes numérisés en 300 dpi. Ensuite on comprend où la perte de qualité se fait, via un article scientifique, et l'on voit que c'est le contours des caractères qui perd en netteté, par la réduction de redondance des couleurs adjacentes du Jpeg. Ainsi en baissant de 100 à 90% la qualité du Jpeg, on obtient une réduction de 50% de la qualité de l'image. On perd de par le fait la possibilité de retravailler des images correctes ultérieurement.

Il semble que l'avenir soit un format permettant de séparer l'arrière plan de l'avant plan (caractères) et de compresser les deux indépendement mais les navigateurs ne prennent pas encore ce genre de format en compte. Selon l'auteur, les évolutions futures des technologies de traitement automatiques des images auront besoin de documents de qualité pour fonctionner. Il est donc pour privilégier la numérisation et la compression de qualité pour le long terme, malgré les côuts.



Commentaire : article concis mais qui pose une question intéressantes pour la conservation des documents. En effet le Jpeg est souvent utilisé pour la faible taille des fichiers engendrés, mais en contrepartie, la qualité des fichiers est fortement dégradée. Pensez à suivre les liens qui vous envoient vers des documents ou des précisions qui sont importants. A noter et consulter, le seul commentaire (que l'on croirait sorti de la bouche de notre grand maitre honoré le délégué de classe roi du monde Fablechat ^^) sur cet article qui renvoie à des formats de compression sans perte et un outils pour utiliser tout ces formats.

28.01.2006

Grille d'analyse n°8 : photothèque du CNRS

Nom et référence

Photothèque CNRS

Types de documents

photos

Tout public : francophone seulement

URL

http://phototheque.cnrs.fr/index.html


Quantité/ taille du fonds

10 000 documents photographiques numérisés


Caractéristiques générales


Dates

non communiqué, assez récentes.

Modes de recherche

Très complet : -la recherche simple permet de chercher un titre ou un mot clé

-la recherche avancée permet de chercher en texte intégral, par thème, mot clé, laboratoire, délégation ou numéro de référence

-un mode butinage est proposé directement, où l'on peut choisir un thème et afficher toutes les photos y correspondant

 

Finesse et pertinence de l’indexation

Tous les documents sont assez bien renseignés, sans suivre toutes les contraintes d'une indexation documentaire. L'indexation est très proche de celle de l'INRA (grille n°7). Les résultats de recherche sont pertinents.

Statut juridique des documents

Une page est dédiée au copyright explique que toutes les photos sont la propriété du CNRS et l'utilisation par une personne est soumise à demande au CNRS.


Caractéristiques Techniques

Nom du fichier

Les documents sont nommés ainsi : 2005nXXXXX, où X est un chiffre et 2005 est une date.

Nombre de pages/fichiers

Non applicable

Taille de chaque fichier

Les fichiers téléchargés font environ 100 Ko maximum, de par la compression Jpeg.

Logiciels de visualisation

On peut lire les images dans n'importe quel navigateur.

Est-ce une BDD unique ou distincte ?

Base de données unique, la photothèque possédant 23 000 documents et 10 000 seulement sont en ligne, le fonds est le même puisqu'on commande les images au centre de documentation.

Métadonnées

Externes aux documents, mais on en trouve en interne aux documents tout ce qui concerne les détails techniques (taille, résolution,...).



Caractéristiques des documents

Couleur ou N/B

Couleur

Lisibilité

Numérisation de bonne qualité

Impression et enregistrement possibles ?

Téléchargement possible en bonne qualité mais les images commandées au centre de documentation sont plus grandes et en meilleures qualité.



Commentaire : encore une collection vitrine, où l'on peut commander le document si l'aperçu nous plaît. Pourtant un bon point est la possibilité de recevoir les documents commandés de plusieurs manières. On peut choisir de les recevoir par courrier (en diapositive), mail (format Jpeg en 300dpi) ou par ftp ou Cd (format tif en 300 dpi). La plupart des documents sont des photos scientifiques mais on pourrait en utilisser beaucoup pour divers illustrations.

27.01.2006

Grille d'analyse n°7 : photothèque de l'INRA

Nom et référence

La photothèque de l'INRA

Types de documents

photos

Tout public : francophone seulement

URL

http://www.inra.fr/Internet/Produits/phototheque/<...


Quantité/ taille du fonds

10 000 documents photographiques numérisés


Caractéristiques générales


Dates

non communiqué, assez récentes.

Modes de recherche

Très complet : -la recherche simple permet de chercher un titre, un mot clé dans le texte libre, possibilité de croiser trois mots.

-la recherche avancée rajoute en plus la possibilité de choisir pour chaque terme de recherche dans quel section il sera cherché (auteur, mots clés,..)

-un mode feuilletage suivant par thèmes, une vingtaine de thèmes proposés.

 

Finesse et pertinence de l’indexation

Tous les documents sont assez bien renseignés, sans suivre toutes les contraintes d'une indexation documentaire. On trouve une dizaine de mots clés par photos, plus une légende (pour l'accessibilité cela doit servir de texte alternatif), le département et le centre de recherche ainsi que le nom de l'auteur. Les résultats de recherche correspondent bien aux demandes.

Statut juridique des documents

Une page est dédiée au copyright explique que toutes les photos sont la propriété de l'INRA et l'utilisation par une personne est soumise à demande à l'INRA. De plus sur chaque photo apparaît le logo INRA en travers de l'image.


Caractéristiques Techniques

Nom du fichier

Les documents sont nommés ainsi : PCDXXXX-IMGXXXX.pcd, ou X est un chiffre. Lorsqu'ils sont téléchargés par un clic droit enregistrer sous, ils s'appellent 4DimageDoc.jpg et se remplacent tous les uns les autres.

Nombre de pages/fichiers

Non applicable

Taille de chaque fichier

Les fichiers téléchargés font environ 100 Ko maximum, de par la compression Jpeg.

Logiciels de visualisation

On peut lire les Jpeg téléchargés avec n'importe quel explorateur internet, et en ligne les images apparaissent dans un script java.

Est-ce une BDD unique ou distincte ?

Base de données unique, la photothèque possédant 55 000 documents et 10 000 seulement sont en ligne, le fonds est le même.

Métadonnées

Externes aux documents.



Caractéristiques des documents

Couleur ou N/B

Couleur

Lisibilité

Numérisation de bonne qualité

Impression et enregistrement possibles ?

Téléchargement possible mais avec le logo de l'INRA en plein milieu. Cette collection est la pour que l'on voit les documents et que l'on les commande à l'INRA.



Commentaire : même si elle n'est pas indexée précisément façons documentation, cette collection est bien organisée et les résultats de recherche sont pertinents. Pourtant il est dommage qu'elle ne soit là que comme une vitrine pour commander les documents physiques. De plus le javascript ne marche pas forcément très bien et il faut parfois réinitialiser la page pour que-celui ci marche.

26.01.2006

Fiche de lecture 8 : web et accessibilité : des technologies au service des non-voyants

Hélène Ochanine

http://www.archimag.com/articles/181/181internet_enqueteh...

 

L'auteur nous invite à une réflexion sur l'accessibilité des sites web pour les déficients visuels. Partie des chiffres d'environ 60 000 non voyants et entre 600 000 et 1.6 millions de malvoyants en France, elle nous annonce d'abord que la technologie a permis de leur donner un accès à l'information numérique (via des logiciels et matériels spécialisés). On trouve par exemple des loupes logicielles ou des logiciels de gestion de contraste et luminosité, des scanner qui grâce ) à la reconnaissance de caractères et à un synthéthiseur vocal peuvent « lire » le texte scanné à haute voix. Pourtant, si la plupart des documents textes sont ainsi accessibles (quelque soit leur format), on ne peut en dire autant des images. Cela vient de la chaîne de production de l'information.


En effet, c'est aux développeurs web et concepteurs de sites qu'il revient la tâche d'adapter leurs sites pour garantir l'accessibilité. Il faut pour cela suivre les règles, établies en 97 par le W3C, qui obligent de créer un texte alternatif pour chaque image. Ce texte serait une description de l'image qui permettrait à un logiciel de lecture vocale ou à un clavier braille de décrire l'image au mal (ou non) voyant. De la même manière, continue l'auteur, les liens trop longs ou non explicite devraient avoir la métadonnée « titre » remplie d'un titre explicite.

Le W3C travail à une simplification des normes déjà établies pour permettre une application plus simple. Le respect de ce code ménera à la consultation de documents en ligne par tout les handicapés, quels que soient leur handicap.

En conclusion, on trouve un encart où Pierre Guillou, responsable de la cellule Accessibilité du Web dans l'association BrailleNet, explique les problèmes de mises en application des normes du W3C. Celles-ci sont en effet parfois peu compréhensibles et difficiles à lire, et c'est pourquoi l'association BrailleNet à rédigé un texte d'application des règles du W3C. Ce texte à donné lieu à un label « AccessiWeb » qui propose 92 critères certifiants l'accessibilité d'un site.



Commentaire

Ce court article montre que l'accessibilité à l'informatique était bien installée mais ne permettait pas l'accès au web de tous et à tout les types de documents. Heureusement des associations prennent les choses en main et développent des cadres afin que tous les sites soient à même d'être visités par des personnes visuellement déficientes. Cet articles parle des sites en général mais on voit très bien le travail qui se profile dans notre milieu, afin de rendre les collections numériques (même de photos) accessibles aux handicapés. Certaines collections étudiés par mes confrères (et soeurs) de cours, ne disposent pas par exemple de texte alternatifs aux photos, et nombreux sont les sites d'institutions qui n'ont pas renseignés correctement leurs métadonnées et ne sont ainsi pas accessibles.


Fiche de lecture 7 : Creating HTML Meta-tags with the Dublin Core Element Set

Par Chistopher Sean Cordes, professeur assistant et bibliothécaire formateur aux Technologies à l'université d'Etat de l'Iowa.

http://eprints.rclis.org/archive/00002569/01/Cordes_Creat...

Cet article tutorial est tiré des archives ouverte E-Lis. Il mentionne tout d'abord le fait que la standardisation et l'utilisation des métadonnées pour identifier les enregistrements en ligne sont devenues presque obligatoires. Il propose donc de nous montrer comment utiliser les standards Dublin Core dans un contexte web, c'est à dire dans du HTML.

Tout d'abord nous avons droit à une présentation des métadonnées dans le HTML, celles ci y sont présentes (balise <meta>) mais de façon trop limitée pour les documents complexes. Que propose le HTML ? La balise <titre> est souvent utilisées par les bots et quelquefois ils prennent même en compte la balise <h1> qui correspond à l'en tête. On y trouve ensuite deux balises de m'étadonnées qui sont : la description et les mots clés. Mais il y a eu de l'abus sur l'utilisation de ces champs et aujourd'hui les bots d'indexation des moteurs de recherche ne les prennent plus en compte.Les documents doivent contenir leurs mots clés dans le texte même.

Ensuite nous avons une explication du Dublin Core. Celui ci est composé de quinze éléments, qui permettent une description constante mais flexible des documents. Les standards peuvent être appliqués à tout types d'objets (préférablement des textes). Pour créer un enregstrement simple, il suffit de remplir les champs comme on le ferati en type MARC. Facile et efficace. L'avantage princpal est la possibilité de répéter les champs afin de renseigner précisément un document.

Tout ceci n'est guère plus évolué que MARC mais selon l'auteur la puissance du Dublin Core se révèle lorsqu'il est mélangé avec le HTML. Il nous montre ensuite via un exemple appliqué au tutorial. Il faut écrire dans la balise « méta name » le champs Dublin Core que l'on utilise et renseigner ce champs dans « méta content ».

Exemple : <meta name=DC.title

content=Creating HRML metadata using Dublin Core : a tutorial>

<meta name=DC.creator

content=Sean Cordes>

Le tutorial se finit sur un encouragement de l'auteur à pousser plus loin la compréhension des éléments du Dublin Core et à se tourner vers d'autres façons de créer des métadonnées en utilisant MARC Xml par exemple, accompagné de liens.



Commentaire :

Ce tutorial est très concis et très bien fait. On nous explique les différentes données qui vont être mises en jeu puis illustre le tout avec un exemple simple et pratique. Il est peu mais bien illustré (exemples et listes claires). Il permettrait, je pense, à n'importe qui (qui ait au moins entendu parler du sujet ^^) de créer des métadonnées pour indexer des documents en ligne. Il est par contre entièrement en anglais et utilise quelquefois du vocabulaire un peu technique, mais je pense qu'il reste accessible à nombre de gens avec un niveau d'anglais moyen et un peu d'aide du dictionnaire.

25.01.2006

Grille d'analyse n°6 : E-LIS, E-prints in Library and Information Science

Nom et référence

E-LIS, E-prints in Library and Information Science

Types de documents

tout textes (résumé de colloques, tutoriaux, travaux de recherche,..)

Tout public : anglophone seulement

URL

http://eprints.rclis.org/


Quantité/ taille du fonds

3236 documents


Caractéristiques générales


Dates

1965-2006, avec peu de documents datant de 1965 à 1990.

Modes de recherche

Très complet : -la recherche simple permet de chercher un titre, un mot clé, de le croiser avec des mots du texte intégral, le nom d'auteur ou de l'éditeur et l'année.

-la recherche avancée permet en plus de rajouter à la recherche un thème, un type de document (livre, chapitre de livre, tutorial,..), la langue, le statut de publication (publié, en presse, non publié), un nom de conférence ou de département.

-un mode feuilletage suivant cinq critères : Livre, Auteur, Sujet, Pays, Année.

 

Finesse et pertinence de l’indexation

Les documents sont très bien renseignés, avec pour chaque document un résumé en anglais et un résumé dans la langue d'origine de document. A noter : seuls les champs d'indexation standard sont affichés dans la notice et il faut cliquer un lien pour « dérouler » les informations des autres champs.

Statut juridique des documents

Une page est dédiée à l'explication de l'utilisation du copyright dans cette archive. Comme c'est une archive ouverte, il est conseillé de permettre l'accès à tous mais certains auteurs peuvent restreindre l'accès à leurs document à certaines personnes connues seulement.


Caractéristiques Techniques

Nom du fichier

Les documents sont nommés par un résumé des mots du texte mais sont séparés en différents sous répertoire à l'intérieur de la base pour qu'il n'y ait pas de redondance.

Nombre de pages/fichiers

Le nombre de pages des documents varie entre une un extrait de chapitre et une plusieurs centaines de pages.

Taille de chaque fichier

La plupart des fichiers ne dépassent pas 1Mo, même les plus volumineux en pages.

Logiciels de visualisation

Acrobat Reader (gratuit) doit être installé sur l'ordinateur pour pouvoir visualiser les documents.

Est-ce une BDD unique ou distincte ?

Base de données distincte puisque les documents sont mis en ligne par tout le monde et ne dépendent donc pas d'une institution qui en aurait la notice.

Métadonnées

Externes aux documents.



Caractéristiques des documents

Couleur ou N/B

Non applicable ce sont des textes.

Lisibilité

Numérisation de bonne qualité

Impression et enregistrement possibles ?

Téléchargement et impressions possibles via Acrobat.


Commentaire : collection très sérieusement organisée de documents professionnels sur la Bibliothèque, la science et les technologies de l'information et sur ce qui sy rapporte. On peut y uploader ses textes sous réserve d'un enrigestrement d'utilisateur. Tous les documents sont dans leur langue d'origine, ce qui permet de mieux les appréhender, mais cela restreint aussi le nombre d'utilisateurs. Cette archive ouverte est avant tout déstinée à des chercheurs et des scientifiques de par la technicité de la plupart des documents mais on y trouve aussi des documents plus accessibles (voir fichelecture n°7).

Fiche de lecture 6 : Cds and Dvds not so immortal after all

Peter Svensson, écrivain sur la technologie pour Associated Press.


http://cnews.canoe.ca/CNEWS/TechNews/2004/05/05/448137.html


Cet article s'ouvre sur l'exemple d'un homme, Dan Koster qui remarque, après un déménagement, que ses Cds sont difficilement lisibles et qu'ils laissaient passer la lumière à certains endroits.

On a ensuite droit à l'explication du phénomène, qui est assez commun. La couche contenant les données se dégrade peu à peu. Dans la collection de Dan, 15 à 20% des cds (pour la plupart des années 80) étaient abimés.

Jerry Hartke, dirigeant de Media Sciences Inc. (laboratoire de test de Cds), nous explique qu'il y a une couche de laque entre la partie reflective (en aluminium) et la partie sur laquelle figure le logo. Si la laque a été mal appliquée lors de la création du Cd, de l'air peut pénétrer dans le Cd et oxyder la couche l'aluminium. Il pense cependant que c'est la mauvaise manipulation des Cds qui est responsable de la majorité des détériorations (frottements entre Cds, stockage sans boitier,...).

Le problème majeur est que l'on pense couramment que c'est la couche inférieure qui est la plus fragile, mais c'est en fait celle qui contient le logo.

Dan décide alors de graver ses Cds sur CdR.

Mais Fred Byers (spécialiste des techniques d'information au National Institute of Standards and Technologie) s'est penché sur ces derniers et les résultats ne sont pas probant. Les matériaux utilisés pour créer CdR et DvDR (même dans une même marque) changent très fréquemment, donc les durées de conservations peuvent varier énormément.

Il ressort aussi de son étude que les DvDs sont un peu plus résistants car la couoche de données est protégée par deux couches plastiques. Mais cela amène aussi un autre problème, puisque la colle entre ces couches peut s'altérer et gêner la lecture.

Les réinscriptibles (RW) sont encore plus fragiles puisqu'ils contiennent une couche sensible à la chaleur, qui s'abime encore plus vite.

Le texte conclut sur des conseils de consevation pour les Cds, comme le stockage à la verticale et comme le vin, ils devraient être conservés dans un endroit frais et sec.

Notre homme de l'exemple, Dan, a un nouvel appartement avec une température plus stable et espère que les prochains support seront plus stables.


Commentaire :

Très bon article, donnant des explications précises sur la déterioration des Cds. Il est de plus assez accessible sans vocabulaire trop technique. Je comprends maintenant pourquoi certains des Cds que je gravais, pour sauvegarder des données, n'étaient pas forcément lisibles après quelques années, le comble pour des sauvegardes. Je savais déjà que la couche supérieure était plus fragile mais j'ignorais que la température avait un tel impact et que le fait de plier un Dvd pour le sortir d'un boitier un peu récalcitrant lui faisait aussi beaucoup de mal. Je recommande sa lecture par mes collègues de projet tutoré.

24.01.2006

Fiche de lecture 5 : Metadata not essential for search

Joab Jackson, membre du GCN (Government Computer News)

 

http://www.gcn.com/vol1_no1/daily-updates/37806-1.html


Selon cet artcile, les métadonnees et préparations avancées de recherche pourraient ne pas être requises pour les documents electroniques gouvernementaux à vocation publique.Cet article est le résultat d'un sondage de l'administration générale des services aux Etats Unis. Selon 56% des experts en recherche interrogés pensent qu'il n'y a pas besoin de preparer les documents pour les moteurs de recherche, au moins pour les documents de types généraux (non spécialisés).

Les autres 44% pensent qu'il faut au contraire soit y ajouter des marqueurs identifiant leur contexte de création, soit créer des vocabulaires controllés de classification, soit les cataloguer manuellement.

Selon les 56 %, la progression technologique des moteurs de recherche leur permet d'être suffisament intuitifs pour que les métadonnées ne soient plus essentielles. Si il y a un gain d'accessibilité grâce à ces dernières, il ne justifie pas le côut de ce catalogage.

Pour les 44 % restants : il faut qu'il y ait des informations supplémentaires, qui pourraient donner l'assurance d'authenticité, de fiabilité et d'intégrité, incrustées dans le contenu afin que les informations ou les enregistrement puissent être dignes de confiance. Ils préconisent donc des préparations de documents avancées.

Ensuite il est fait mention que les auteurs du rapport acceptent l'approche non interventionniste, c'est à dire ne pas rajouter de metadonnées, et la considère comme le meilleur choix pour les sites web les mails et les types de documents au contenu peu structuré. Les documents plus spécialisés pourraient bénéficier de techniques de classification avancées et les documents à caractères hautement techniques devraient être classés avec des vocabulaires controlés, ainsi que les documents audios et vidéos.

Enfin dans la conclusion, on nous dit que la mise en ligne directe de ces documents permettra de rendre vraiment effective la recherche et le partage des informations gouvernementales.


Commentaire :

Texte assez dur à comprendre, avec pas mal de termes techniques. Le modèle de pensée américaine à l'oeuvre, c'est à dire que si ca ne rapporte pas d'argent, ce n'est pas utilisable. Ici c'est encore pire puisque l'opération de préparation coute des sous, pour une certaine plus value quand même, celle de permettre une recherche très précise de documents. Mais la plus value n'est pas suffisament intéressante pour la majorité de ces experts américains, qui préconisent donc au gouvernement de publier ses documents à destination du public directement sur le Net sans préparation, afin de faire des économies.

Je trouve que tout ce qui est dit dans cet article est assez choquant, puisque les économies annoncées ne compenseraont surement pas la perte de la qualité de recherche.

Toutes les notes