Après la révolution du web social, Internet pourrait être bouleversé par le web sémantique, un moyen de relier entre elles les informations stockées sur le Net, et de les rendre plus accessibles.

Ancêtre du web sémantique, la stagiaire qui cherche des infos à droite à gauche
Ancêtre du web sémantique, la stagiaire qui cherche des infos à droite à gauche

Tim Berners-Lee n’est pas n’importe qui : il est (tout simplement) l’inventeur du Web. En 2001, il s’investit dans un nouveau bébé par le biais du W3C (World Wide Web Consortium) : le web sémantique, ou web de données. Ce projet, sur lequel Berners-Lee réfléchissait depuis le milieu des années 90, vise à exploiter au mieux le « Big data », en créant des liens entre les ressources stockées dans différentes bases de données et fichiers.

En route pour le web des métadonnées

« Dans le monde de l’entreprise comme dans le monde du Web, on trouve un grand nombre de silos de données, explique Dominique Cotte, consultant à l’ADBS (Association des professionnels de l’information et de la documentation). Ces données peuvent parler des mêmes choses, sans forcément être en relation. L’enjeu du web sémantique est d’utiliser ces métadonnées, qui sont présentes sur le Web, pour mettre en relation l’information et la partager. Il peut s’agir par exemple d’un catalogue de bibliothèque, d’une base de données présente sur le site d’un musée, et d’informations touristiques stockées sur le site d’une mairie. L’objectif est de parvenir à piocher dans ces trois sources des informations pertinentes de façon automatisée et efficace. » Le web sémantique s’appuie sur des outils tels que Dbpedia, un projet universitaire qui propose une version normalisée de contenus encyclopédiques. Il permet notamment de relier Wikipedia à d’autres sites de données ouvertes. Concrètement, pour une requête du type « Ville européenne de plus de 20 000 habitants », un moteur de métadonnées peut produire une liste d’occurrences correspondant aux critères demandés, en s’appuyant si besoin sur plusieurs bases de données différentes.

Là où l’avènement du web social a représenté un bouleversement spectaculaire et foudroyant, la révolution du web de données devrait s’avérer plus lente, mais potentiellement tout aussi fondamentale. En France, les premières expérimentations concrètes sur le champ du web de données commencent à faire leur apparition dans le domaine de la culture. Le site de la Bibliothèque nationale de France (BNF) fait partie des références en la matière. En s’appuyant sur le web sémantique, elle permet des passerelles entre ses catalogues et ceux d’autres bibliothèques nationales, comme la bibliothèque du Congrès aux Etats-Unis. La BNF, qui ne produit pas de biographies d’auteurs, peut également récupérer des éléments de biographies de sites comme Wikipedia, ou récupérer des images du site Europeana. « En assemblant ces éléments par le biais du Web comme un réseau de données, on arrive à une production issue de la fusion de ces informations », conclut Nicolas Chauvat, le PDG de Logilab, qui a réalisé le site de la BNF. Ce système permet des économies de temps et des réductions de coûts, puisque les informations ne sont ni recherchées, ni hébergées par les sites qui les utilisent.

Généralisation de l’open data

Si le W3C travaille sur le web sémantique depuis plus d’une décennie, ces premiers résultats sont rendus possibles aujourd’hui grâce à la généralisation de l’open data. « De plus en plus de gens prennent conscience que si les organismes publics mettent à disposition sur le Web les données qu’ils produisent dans le cadre de leur mission, des organismes peuvent reprendre ces informations pour en faire ressortir des choses intéressantes, remarque Nicolas Chauvat. L’information est le carburant qui permet d’avancer pour nombre d’activités économiques dans le domaine du tertiaire. » L’enjeu est donc d’échanger ce socle d’informations, en l’enrichissant et en l’élaborant au fur et à mesure des échanges.

Si la culture est aujourd’hui le champ privilégié des recherches en matière de web sémantique, d’autres domaines pourraient en bénéficier, comme le secteur de la santé ou celui de l’éducation. Une dynamique pour l’heure difficile à transposer dans le monde de l’entreprise en raison de l’épineuse question des données ouvertes. « Certaines entreprises s’intéressent au décloisonnement de leurs informations, mais cela pose des problèmes, de sécurité notamment », remarque Mehdi Benchoufi, le fondateur du Club Jade, un think tank dédié aux nouvelles technologies. Pourtant, les spécialistes s’accordent à dire que les entreprises ont beaucoup à gagner en adoptant cette technologie. Certaines y font déjà appel en piochant dans des bases de données telles que Google Maps ou Datagov.fr. « La situation est semblable à ce qu’on a vu dans les années 90 avec les messageries d’entreprise, précise Mehdi Benchoufi. Chaque société développait des solutions en interne, mais elles ont abandonné ces systèmes quand le Web a pris son essor, avec l’arrivée du courrier électronique. Ce qui fonctionne à l’échelle d’Internet fonctionne à l’échelle d’une entreprise. De mon point de vue, le même phénomène est appelé à se produire sur le plan des données. ».

Article réalisé par Ronan Penetti

Répondre

Saisissez votre commentaire
Saisissez votre nom ici