Billets juillet 2024 [2]

Forum Teratec 2024

04/07/2024

Nous avions un stand sur le boulevard de l'IA lors du Forum Teratec 2024.

Nous y avons parlé d'Onyxia, un logiciel libre qui permet d'offrir, via un navigateur web, des environnements de traitement et de manipulation de données tels que Jupyter, OpenRefine, etc.

Nous envisageons d'en faire le successeur de notre JupyterApps que nous utilisons pour diverses applications, dont la formation.

Nous y avons aussi présenté une démo d'utilisation d'un modèle de langue pour interroger en RQL le site SemWeb.Pro. Les techniques de RAG se révèlent en effet efficaces pour générer des requêtes RQL à partir d'une base d'exemples bien construite.


Forum entreprendre dans la culture en 2024

04/07/2024

Mi-juin 2024, nous étions invités au forum entreprendre dans la culture, qui a réuni pendant trois jours divers professionnels engagés dans la valorisation du secteur culturel, en particulier avec des moyens numériques.

L'événement a mis en lumière des problématiques communes, notamment en matière d'indexation de contenu, mais aussi aux différents aspects de l'usage des techniques d'intelligence artificielle. Entre impact environnemental, modification du processus de création et aide à la reconnaissance d'image et de texte, ces outils désormais incontournables changent le paradigme des données dans la culture.

Nous avons participé à l'atelier sur les défis et enjeux de la mutualisation des données, qui a mis en avant des projets de fusion de données hétérogènes auxquels nous collaborons, tels que Cap Data Opéra et FranceArchives.

L'INA a animé un atelier sur l'indexation automatique de leurs contenus vidéo et a abordé entre autres des problématiques d'alignement avec des référentiels externes, tels que Wikidata, que nous connaissons bien pour les traiter nous aussi sur de très gros volumes de données au sein de FranceArchives ou de Data.BnF.