|
BilletsNous remercions vivement tous les participants de cette dernière édition 2024, qui ont participé aux discussions et présenté leurs travaux !
Cette édition 2024 a subi un léger lifting: nous avons modifié le format de la conférence en réduisant le nombre de présentations au profit de plus de temps pour les échanges pendant une session poster ouverte par des présentations éclairs (moins de 3 min pour présenter son sujet et donner au public l'envie d'en savoir plus).
Comme chaque année depuis 2020, Pierre-Antoine Champin est venu faire le bilan des avancées des différents groupes de travail de l'écosystème Data and Knowlegde du W3C.
Nous espérons que ce nouveau format vous aura plu !
Pour tous ceux qui n'ont pas pu être présent, vous retrouverez les supports des présentations et les vidéos SemWeb.Pro 2024 et sur PeerTube.SemWeb.Pro.
La prochaine édition de la conférence SemWeb.Pro, qui se tiendra en novembre 2025, est déjà en préparation. Si vous souhaitez recevoir les annonces, abonnez-vous à la liste de diffusion en envoyant un mail à contact at semweb.pro ou bien suivez le compte mastodon.logilab.fr/@semwebpro ! Nous avions un stand sur le boulevard de l'IA lors du Forum Teratec 2024.
Nous y avons parlé d'Onyxia, un logiciel libre
qui permet d'offrir, via un navigateur web, des environnements de traitement
et de manipulation de données tels que Jupyter, OpenRefine, etc.
Nous envisageons d'en faire le successeur de notre JupyterApps que nous utilisons
pour diverses applications, dont la formation.
Nous y avons aussi présenté une démo d'utilisation d'un modèle de langue pour
interroger en RQL le site SemWeb.Pro.
Les techniques de RAG se révèlent en effet efficaces pour générer des requêtes RQL à partir d'une base d'exemples bien construite. Mi-juin 2024, nous étions invités au forum entreprendre dans la culture, qui a réuni pendant trois jours divers professionnels engagés dans la valorisation du secteur culturel, en particulier avec des moyens numériques.
L'événement a mis en lumière des problématiques communes, notamment en matière d'indexation de contenu, mais aussi aux différents aspects de l'usage des techniques d'intelligence artificielle. Entre impact environnemental, modification du processus de création et aide à la reconnaissance d'image et de texte, ces outils désormais incontournables changent le paradigme des données dans la culture.
Nous avons participé à l'atelier sur les défis et enjeux de la mutualisation des données, qui a mis en avant des projets de fusion de données hétérogènes auxquels nous collaborons, tels que Cap Data Opéra et FranceArchives.
L'INA a animé un atelier sur l'indexation automatique de leurs contenus vidéo et a abordé entre autres des problématiques d'alignement avec des référentiels externes, tels que Wikidata, que nous connaissons bien pour les traiter nous aussi sur de très gros volumes de données au sein de FranceArchives ou de Data.BnF. Logilab a participé en mai 2024 à l'émission "Libre à vous" sur radio Cause Commune, pour y parler des résultats du projet Role Models, qui étudie les modèles d'organisation ouverts dans les entreprises du logiciel libre.
Pour en savoir plus, vous pouvez écouter le podcast depuis la page de l'émission 209 du 28 mai 2024 ou bien lire la transcription. Nous étions les 2 et 3 mai 2024 à Louvain, en Belgique, pour le second symposium sur Solid, qui a réunit une centaine de personnes d'une vingtaine de nationalités au sein d'une université multi-centenaire pour discuter du futur des applications web.
Solid (SOcial LInked Data) est un projet initié par Tim Berners Lee, l'inventeur du Web. Le projet Solid vise à définir, sous l'égide du W3C, un ensemble de protocoles pour gérer l'authentification, l'authorisation et l'accès au données dans les applications web, en permettant aux trois aspects d'être séparés et donc conjugués à partir de fournisseurs différents pour chacun d'eux.
Grâce aux avancées dans ce domaine, les applications du web social de demain vous permettront du vous authentifier à partir du fournisseur d'identité de votre choix (pensez à ces boutons "login with google", "login with facebook", mais intégrés directement dans votre navigateur et sans se limiter aux GAFAM) et d'utiliser votre propre espace de stockage qui n'exposera que les données auxquelles vous accorderez l'accès (pensez à une sorte de Google Drive ou de NextCloud avec des permissions avancées et des données structurées telles que des personnes ou des événements, partagées par toutes les applications que vous utilisez). Avec Solid, fini les recopies d'un silo à l'autre !
Merci à tous les participants pour des discussions enrichissantes et rendez-vous l'an prochain pour la suite. D'ici là, passez nous voir à SemWeb.Pro en novembre à Paris si vous vous intéressez à Solid.
Nous venons de mettre en ligne un site vitrine dédié à notre offre centrée sur la construction de graphes sémantiques, que nous avons nommée SemGraph.
En s'appuyant sur les standards du Web et une architecture décentralisée, les outils indépendants de la suite SemGraph se complètent pour permettre la mise en réseau de données issues de multiples applications disjointes.
Les graphes de connaissances ainsi constitués apportent une valeur inégalée en faisant apparaître des relations auparavant invisibles et en servant de base à de multiples applications d'intelligence artificielle. Nous avons eu le plaisir les 18 et 19 novembre 2023 de participer au Capitole du Libre, que ce soit en tant qu'orateur que visiteur.
Le Capitole du Libre regroupe chaque année sur le campus de l'ENSEEIHT de Toulouse de nombreux passionnés et entreprises autour de conférences sur les logiciels libres et leur impact sur la société. En tant que développeur et utilisateur de logiciels libres depuis plus de vingt ans, Logilab participe régulièrement à cet événement Toulousain.
Cette année Élodie a réalisé une présentation pour vulgariser le Web de données, l'histoire de ses standards ainsi que son utilité pour l'interopérabilité des données et la décentralisation. La conférence a été filmée et la vidéo est disponible sur la chaîne Youtube de l'événement.
Nous avons aussi assisté à de nombreuses autres conférences tout le weekend ce qui nous a permis de découvrir de nouvelles technologies ou solutions libres.
Nous participerons, bien entendu, à la prochaine session du Capitole du libre. Nous avons déjà hâte de vous y rencontrer ! Cette année encore, Logilab a eu le plaisir de vous convier à la conférence SemWeb.pro 2023.
Nous remercions chaleureusement tous les participants et participantes, ainsi que les présentateurs et présentatrices et les membres du comité de programme de cette édition 2023.
Cette édition était riche de 13 présentations aussi intéressantes et animées les unes que les autres. Certains ont pris le risque de la démo et s'en sont sortis avec succès !
Les sujets abordés permettent de se rendre compte de l'air du temps concernant l'utilisation des
technologies du Web Sémantique dans un cadre professionnel. Les travaux présentés concernaient le milieu de l'agriculture, des statistiques, de l'édition d'ouvrages scolaires ou encore des archives.
Tous ces exemples permettent de se rendre compte de l'impact de ces technologies dans de nombreux domaines. Cette année, une place de choix a été accordée à l'utilisation des grands modèles de langues, qui apportent déjà un vent de nouveauté dans les techniques de traitement des données.
Toutes les vidéos des présentations sont accessibles sur https://peertube.semweb.pro/w/p/af3G6oBrS74CyPb6WDwq4U/ si vous souhaitez voir ou revoir certaines explications et démonstrations.
Nous invitons toutes les personnes présentes à répondre au questionnaire qu'elles ont reçu dans notre dernière lettre d'information.
Vu les riches échanges qui ont eu lieu durant cette édition, nous sommes convaincus que cette journée a son utilité et nous allons lancer l'organisation de la session 2024.
En vous abonnant à notre lettre d'information ou en suivant notre compte https://mastodon.logilab.fr/@semwebpro , vous vous tiendrez au courant du prochain appel à communication et des dates clés de l'événement.
En espérant vous croiser à la prochaine édition fin 2024. Début juin, l'émission de radio Libre à Vous, animée par l'April, a ouvert son micro au projet Role Models, qui a décrit sa manière d'étudier (à son petit rythme) les modèles d'organisation ouverts dans les entreprises du logiciel libre.
Logilab, qui s'est inspirée des valeurs du logiciel libre pour sa propre organisation, apporte son soutien à ce projet, initié par le dirigeant de la société.
Pour en savoir plus, consultez la liste des productions du projet, écoutez le podcast ou lisez la transcription de l'émission. 400 mots: ~3min
Après une décennie d'accompagnement de grandes institutions culturelles dans la gestion et la publication de leurs données, Logilab propose un parcours complet de formation pour découvrir et contribuer au Web des données (ou Web sémantique).
Le Web sémantique est l'ensemble des technologies et standards pour rendre des données accessibles sur la toile de manière décentralisée et les lier entre elles. Les données publiées de cette façon se complètent les unes les autres, comme les articles qui se référencent mutuellement sur le Web via des liens hypertexte. A l'instar du Web des documents où tout un chacun peut publier des pages Web et y placer des liens vers les pages déjà existantes, les standards du W3C pour le Web sémantique permettent de publier des données en y insérant des liens vers les autres données déjà existantes.
Une première formation permet de découvrir pas à pas les notions du Web des données, en allant de l'hypertexte du Web des documents jusqu'aux ontologies du Web Sémantique et en passant par le cycle de vie des données et les standards de publication et d'interrogation. L'objectif de la formation est de repartir avec des points de repères clairs sur le sujet.
Une deuxième formation est dispensée afin d'apprendre à contribuer au Web des données dans le respect des standards du W3C. Les principales techniques de description de ressources et de publication sont abordées sous un angle concret avec des exercices de mise en pratique. L'objectif étant d'apprendre à passer d'un ensemble de données CSV à un entrepôt SPARQL contenant des triplets RDF de ces données et de les interroger en SPARQL.
Une troisième formation complète le parcours en abordant la réalisation d'un projet mettant en place les techniques du Web des données. Le but est de fournir des principes servant de boussole pour garder le cap d'un projet de ce type et ne pas passer à côté des caractères différenciant qui font l'intérêt du Web Sémantique.
À l'issue de ces formations, qui ont déjà été suivies par plusieurs dizaines de personnes, les participantes et participants seront à même de proposer à l'institution ou l'entreprise qui les emploie une stratégie adaptée à ses objectifs de valorisation et de diffusion et de les mettre en œuvre en publiant des données sur le Web sémantique.
|