Les bibliothèques numériques

Les bibliothèques numériques

Les bibliothèques numériques

Par Julie Anne

Europeana est enfin en ligne... après quelques bugs, et beaucoup de ricanements ! Son ouverture au public permet de se pencher un peu plus sur les bibliothèques numériques qui fleurissent sur la Toile depuis quelques temps. Cela implique de reconsidérer à la fois les moyens qui vont nous être désormais offerts -mise à disposition et l'accessibilité grand public du livre-, mais aussi notre approche patrimoniale, voire sentimentale, au livre.

Une des grandes questions liées à l'essor des numérisations de livres accessibles en ligne tient en ceci : est-ce seulement une facilité donnée aux chercheurs et curieux de tout poil pour satisfaire à leurs demandes, ou est-on vraiment à la porte d'une révolution complète de la conception de la recherche, de la quête d'information, et de la relation même au livre en tant qu'entité matérielle ?
Dématérialisé, accessible depuis n'importe où, notre rapport à l'objet culturel et patrimonial par excellence pourrait s'en voir complètement transformé...

La question est d'importance, car si elle va d'abord concerner les profils de personnes intéressées en premier lieu par une telle facilitation de la recherche (étudiants, enseignants, chercheurs), elle pourrait bientôt concerner toute la population... Une révolution démocratique (ou qui se veut telle) semblable à celle de l'imprimé ou du livre de poche ?

Pour commencer la réflexion...

...on peut s'attarder sur le schéma présenté sur le site de Jean-Michel Salaün et extrait d'un bilan sur les usages et attentes des utilisateurs (Bibliothèque nationale de France, 7 juin 2007). L'étude s'attache à clarifier les différentes approches de trois catégories d'utilisateurs envers une bibliothèque numérique patrimoniale : grand public, "initiés" (chercheurs, étudiants..) et bibliothécaires (professionnels de l'information). De quoi faire réfléchir sur la complexité de la mise en place efficace d'un service public (TOUT public) de bibliothèque numérique.

Le billet de Jean-Michel Salaün
http://blogues.ebsi.umontreal.ca/jms/index.php/2008/08/11/509-grand-public-inities-bibliothecaires

Le rapport de la BnF
http://bibnum.bnf.fr/usages/BnF_Europeana_EtudeUsages2007.pdf

Les poids lourds

1 - Gallica et Gallica 2

Gallica, développé par la BNF, est le "grand ancêtre" : contenu riche (80 000 documents numérisés), mais navigation un peu laborieuse, et une numérisation format " image " qui restitue des pages magnifiques, mais sans possibilité de faire une recherche dans le contenu. Elle restera comme le première tentative en Europe de numérisation d'un catalogue de bibliothèque, et aura servi de prototype à Europeana. Le projet se poursuit avec sa nouvelle version, Gallica 2, mêlant cette fois format "image" et format "texte" : on parle d'ailleurs de "rétronumérisation" (c'est-à-dire le passage en mode texte des documents numérisés en mode image) pour les documents déjà traités.
Ce nouveau site offre ainsi des livres, de la presse, des revues, des images et des cartes et plans, des documents sonores, manuscrits et partitions (ouf!), avec une visualisation plus légère, une recherche des occurrences et une indexation par les moteurs de recherche.
Depuis mars 2008, on peut faire une recherche sur plusieurs milliers de titres de l'édition contemporaine, soumis par conséquent au droit d'auteur, accessibles au format numérique via des sites de e-distributeurs (en accès libre ou sous conditions).
Possibilité est également désormais offerte de créer son espace personnel, où on peut stocker ses trouvailles et même des marques-pages à l'intérieur des ouvrages. Excellent initiative tant la multiplication des stockages d’information se couple d’un risque d’infopollution, même pour des personnes averties comme les documentalistes !
Des itinéraires de découverte sont offerts -avec les dossiers thématiques et des propositions en page d'accueil- à choisir entre les différentes catégories : personnage, lieu, œuvre, événement, et sujet.
La gourmandise : la presse quotidienne française du XIXe siècle à 1944. Avec une facilité de consultation, de navigation et de visualisation incroyable !

Gallica2
http://gallica2.bnf.fr/
Historique du projet
http://www.bnf.fr/pages/dernmin/bnue_chronologie.htm
Les dossiers thématiques de Gallica
http://gallica.bnf.fr/scripts/Page.php?/Les_Dossiers.htm?
Schéma présentant très simplement la plate-forme d'accès aux documents numériques
http://www.bnf.fr/pages/catalog/pdf/gallica2_schema.pdf


2 - Google Books Search

...ou quand le mercantilisme se mêle de philanthropie
En 2004, Google lance son catalogue de bibliothèque numérisée mondiale, avec possibilité non négligeable cette fois de faire une recherche plein texte. En collaboration avec les plus grandes bibliothèques publiques et universités, avec plus de 10 millions de titres à ce jour, (principalement issu des bibliothèques américaines), il se veut le facteur de démocratisation d'accès à la culture.
Petit hic : Google a essuyé une très médiatique procédure judiciaire pour non-respect des droits d'auteurs. S'il a traversé les affres de la mise à l'index (juridique et surtout morale) de l'Europe, très sourcilleuse sur ce point-là, il semble que la tempête se soit mieux terminée aux Etats-Unis. La tempête a levé un bel ouragan en Europe et a donné lieu à un texte très remarqué de Jean-Yves Jeanneney (voir ci-après, le projet Europeana).
Le programme Google print s'appuie sur deux sources distinctes : les bibliothèques et les "programmes partenaires" (éditeurs et auteurs, avec liens pour faire l'achat des ouvrages demandés en requête). Une présentation intégrale est possible pour les œuvres libres de droits, 20% maximum pour les oeuvres récentes sous droits, avec liens vers les librairies ou les bibliothèques pour trouver l'ouvrage concerné.
Depuis, après les bibliothèques américaines, Google a fait de la retape dans le patrimoine européen, en avançant un argument très lourd : il prend financièrement à sa charge les frais de la numérisation des ouvrages (comme pour la Bibliothèque d'état de Bavière, celle de Catalogne, etc...)..
Avec un profil au final plus "librairie" que "bibliothèque" (avec des connexions commerciales), il propose par exemple de pouvoir offrir aux internautes l'accès à des livres épuisés (et se targue ainsi "de protéger l'histoire culturelle de l'humanité " sic ! ). Moyennant finances bien sûr...
Le public pourra ainsi se constituer sa propre bibliothèque numérique à partir de ses achats (pour les livres concernés). D'autres fonctions annexes, comme MyLibrary -proposant un espace de partage et de commentaires entre internautes- sont disponibles.

Le projet
http://books.google.com/intl/fr/googlebooks/agreement/
MyLibrary
http://books.google.com/googlebooks/mylibrary/

3 - Europeana, la bibliothèque numérique européenne

...est enfin en ligne, après que les serveurs ont été débordés lors de son premier lancement le 20 novembre 2008. En version bêta (encore 2 ans avant la version 1.0), mais disponible pour des consultations. Décrit par certains comme une multitude de projets européens imbriqués, Europeana est l'aboutissement de différents prototypes, différentes expérimentations techniques, comme Gallica 2, avec une interface graphique et une indexation plein texte plus évoluée.

Ce projet est une forme de contre-offensive, avec le coup de gueule de Jean-Noël Jeanneney. La réaction du président de la BNF se traduit par des articles dans le quotidien Le Monde, puis par la publication du célèbre plaidoyer "Quand Google défie l'Europe : plaidoyer pour un sursaut" (Editions Mille et une nuits, isbn = 2842059123). Ce sursaut français est à l’origine d’un travail collectif qui lance l'idée d'une BNUE (Bibliothèque Numérique de l'Union Européenne). Objectif : concurrencer le très controversé Google prints (devenu Google Books search).
La Commission européenne reprend le flambeau en avril 2006 et aboutit au projet Europeana, lancé en mars 2007. L'horizon pour 2010 est fixé à 10 millions de documents numérisés, représentatifs du patrimoine historique et culturel de l'Europe, avec comme cadence près de 100 000 ouvrages par an, et près de 2500 documents mis en ligne par semaine !
Pour la France - fournisseur pour l'instant majoritaire des œuvres (52% : problème d'un projet " européen " monopolisé par les Français?), les œuvres sont prises bien évidemment de la BNF, mais aussi d'autres centres de ressources (IRCAM, INA...), offrant ainsi, contrairement à Google, un registre également cinématographique, musical et pictural.
Ce site propose également une meilleure pertinence des résultats de recherche, grâce à une hiérarchisation plus critériée et des suggestion de documents associés, une frise chronologique dynamique, un planisphère de recherche...
Si l'Europe chapeaute l'ensemble, il revient à chacun des états participants de prendre en charge la numérisation de leurs ouvrages (pour la numérisation, voir infra). L'ambition du portail multilangue est à la mesure de l'effort demandé aux états : pas moins de 22 langues devraient pouvoir être utilisées sur le site.
A terme, de grandes ambitions : des outils de traduction multilingues automatiques, et une interface interactive et personnalisable. Texte de la brève. Texte de la brève. Texte de la brève. Texte de la brève.
Texte de la brève. Texte de la brève. Texte de la brève. Texte de la brève.
Le site http://www.europeana.eu/portal/
Une vidéo de démonstration : http://dev.europeana.eu/

Les poids plumes : petits, mais costauds ?

1 - IGN
L'établissement public s'est mis à l'heure du XXIème siècle et propose ses cartes en ligne, des photographies aériennes, un espace éducation, un lien vers géoportail...
Le site
http://www.ign.fr/
L'espace éducation
http://www.ign.fr/institut/accesRapide.do?rubrique=true&currentRootSearch=Educa
tion&indexChildSearch=1

2 - TEL, The European Library
Mise en ligne en mars 2005, The European Library vous propose un accès aux collections de 32 des 48 bibliothèques nationales européennes. Les résultats, pour une même requête, sont au préalable classés par bibliothèques, et portent sur du contenu à la fois numérique (livres, affiches, enregistrements sonores, vidéo, etc.) et bibliographique La suite : TELplus (2007-2009) est un projet financé par la Communauté européenne; plus de 20 millions de pages en plusieurs langues seront converties à la reconnaissance optique de caractère (OCR) .

Rapport entre TEL et Europeana ? TEL a été reconnue par la Commission européenne comme base organisationnelle de la future BNUE (Bibliothèque numérique européenne), devenue depuis Europeana, et qui concernera non seulement les bibliothèques mais également les musées, les archives et d'autres institutions patrimoniale.
http://search.theeuropeanlibrary.org/portal/fr/index.html

3 - Bibnum : textes fondateurs de la science
Depuis peu en ligne, le projet, mené par le CERIMES (Centre de ressources et d'information multimédia pour l'enseignement supérieur), mais destiné à un public très large, est simple et alléchant, comme il est dit dans sa préface : proposer une bibliothèque numérique scientifiques de textes d'origine, antérieurs à 1940, commentés et analysés pour leur impact dans la science et la technologie actuelle par des scientifiques contemporains.
Une quinzaine de textes, surtout physiques et mathématiques, commentés à ce jour, avec à chaque fois information, actualité, et analyse du document présenté, liens et bibliographie, et documents à télécharger. Un moteur de recherche interne s'utilise sur les informations entourant chaque pièce. Et un "texte du jour" en page d'accueil !
Le site
http://bibnum.education.fr/

4 - MICHAEL, Multilingual Inventory of Cultural Heritage In Europe
Soutenu par la Commission Européenne dans le cadre du programme eTen (dédié au déploiement des nouvelles technologies en Europe), ce portail se propose d'offrir un accès aux collections numériques de toute l'Europe, en s'axant sur l'intégration d'initiatives nationales pour la numérisation du patrimoine culturel et l'interopérabilité entre les portails culturels nationaux.
Chaque catalogue national comprend des descriptions de collections numériques et de sites Internet, cédéroms et autres services et produits qui ont été créés par les musées, bibliothèques et archives. Depuis l'été 2008 proposé en 16 langues, des articles proposent régulièrement des parcours de découverte, tandis que la navigation, originale, offre de commencer la recherche par collection numérique, par institutions ou par sites ou supports numériques dédiés (CD, DVD).
Le portail
http://www.michael-culture.org/fr/home

5 - Live search books
Lancé en 2005, ce projet de Microsoft n'aura pas fait long feu. La base de 750000 livres restera consultable sur le moteur search, mais le projet a été stoppé début 2008 : modèle économique pas rentable, selon Microsoft (un avant-goût des velléités philanthropiques de Google ?). La firme avait réussi à avoir dans sa poche la British Library tout de même !
http://www.lemondeinformatique.fr/actualites/lire-microsoft-arrete-les-frais-po ur-live-search-book-26165.html

Quelques réflexions et un zeste de technique

Pour agrémenter vos découvertes nous vous proposons un ensemble de textes critiques à lire le soir au coin du feu…

Pour tous ces sites, deux points technologiques majeurs qui peuvent s'avérer critique à gérer : la numérisation et l'accessibilité. Deux points où, pour l'instant, Europeana semble un peu à la traîne par rapport à Google (qui, lui, propose gratuitement numérisation et indexation aux bibliothèques et aux
éditeurs)
Jusqu'à un meilleur investissement financier de la Communauté européenne? Car le nerf de la guerre, après le volet " droits d'auteurs ", semble bien financier...Quand on estime le coût à environ 40 euros par livre (selon la BNF), soit 350 à 400 millions d'euros selon certains, à charge donc de chaque état pour Europeana... mais avec seulement deux millions consacrés par la Commission européenne pour le fonctionnement (et 14 personnes pour l'instant seulement), beaucoup de monde se pose des questions !

Un blog de référence : le blog bibliothèque numérique S'il s'attache toujours à suivre le projet de bibliothèque numérique européenne, ce blog traite des autres projets du monde entier, et offre un éclairage pertinent sur les avancées, les critiques, et les polémiques.
http://bibnum.over-blog.com/

La numérisation de masse des documents à l’œuvre pour Gallica
Le processus de numérisation de masse a été lancé par la BnF en 2008, avec le soutien du Centre national du Livre. Il est intéressant de voir ainsi comment, en passant du format " image " au format " texte ", on peut utiliser ensuite un outil de recherche plein texte.
On peut voir avec cette vidéo, les principales étapes du processus de numérisation, qui transforme un livre physique en un livre numérique. http://www.bnf.fr/pages/zNavigat/frame/bibliotheque_numerique.htm?ancre=num_masse.htm

Connaissez-vous l'OCR ?
Terme rencontré fréquemment lorsque l'on s'attache à comprendre comment marche l'indexation des documents numérisés : " La reconnaissance optique de caractères (Optical Character Recognition) désigne les procédés informatiques pour la traduction d'images de textes imprimés ou dactylographiés en fichiers de texte " . C'est cette technologie dont se sert Europeana pour rendre véritablement utilisable l'immense base de données constituée..
Article de Wikipedia
http://fr.wikipedia.org/wiki/OCR

Europeana vs Google : le match
Très bon article expliquant les différences, avantages et inconvénients de Gallica, Europeana et Google.
Le match
http://www.fluctuat.net/6588-Google-vs-Europeana

En guise de conclusion…

... provisoire et d'avant-goût du futur, on pourrait retenir l'analyse d'Olivier Ertzscheid sur son blog Affordance :
" Il faut prendre l'épisode du lancement raté de ce grand projet [Europeana] pour ce qu'il est : une fable moderne pleine d'enseignements sur la mesure et le périmètre d'un service public numérique à l'heure et à l'ère de l'accès comme clé de voûte bibliothéconomique renouvelée ".
Le billet d’Affordance : http://affordance.typepad.com/mon_weblog/2008/11/europeana-3-petits-tours-et-puis-.html

Source: Le Café 99 : Ed. intégrale 2/4