Skip to main content

Créer un vocabulaire en SKOS à partir d’un fichier tabulé avec Sheet2RDF dans VocBench

Le dernier volet de notre série d’articles autour de la transformation de vocabulaires tabulés vers une représentation en SKOS est en ligne : Transformer un fichier tabulé en SKOS avec Sheet2RDF (VocBench).

Pour rappel, le projet FooSIN a expérimenté SKOS Play! ConvertirOpenRefine et Sheet2RDF intégré à VocBench et vous propose :

Lisez également l’introduction à SKOS.

Créer un vocabulaire en SKOS à partir d’un fichier tabulé

Découvrez la suite de notre série de ressources autour de SKOS, un test comparatif d’outils pour transformer un fichier tabulé en SKOS.

Utiliser des outils métiers s’appuyant sur SKOS pour visualiser ou éditer un vocabulaire, l’exposer sur un portail publique comme Agroportal ou Loterre ou, de manière plus générale, pour rendre la ressource utilisable dans un système d’information ou par d’autres utilisateurs, en d’autres termes pour le rendre plus FAIR :  plus Facile à trouver (Findable), Accessible, Interopérable, Réutilisable (Reusable), les motivations pour passer à SKOS peuvent varier. Il existe des outils qui facilitent ce travail de transformation et vous assurent d’obtenir une ressource conforme au standard sans nécessairement être un expert en SKOS.

FooSIN a expérimenté SKOS Play! Convertir, OpenRefine et Sheet2RDF intégré à VocBench et vous propose :

 

SKOS, un allié pour les principes FAIR

Le projet FooSIN inaugure aujourd’hui une série de ressources en lignes autour de SKOS, un modèle RDF standard pour représenter et échanger des vocabulaires simples.

En effet, les vocabulaires et autres référentiels terminologiques jouent un rôle important dans le cycle de vie de la donnée et contribuent à la mise en œuvre des principes FAIR.

Ils permettent de documenter les objets étudiés, les variables enregistrées dans les bases de données, les méthodes utilisées dans le cadre des expérimentations… Ils facilitent la recherche et la réutilisation des jeux de données et des publications par exemple. Les vocabulaires participent également à réaliser l’interopérabilité sémantique des objets numériques et des systèmes d’information qui les stockent et les exposent. Ils permettent de savoir si deux systèmes font référence ou non à une même notion. Pour qu’ils puissent remplir ces différents rôles, les vocabulaires doivent être représentés selon un modèle standard. Ils doivent aussi être partagés avec la communauté dans des portails dédiés qui facilite leur réutilisation et leur interconnexion.

FooSIN a choisi de s’intéresser à SKOS car

  • c’est un modèle créé par le W3C plutôt simple à comprendre,
  • suffisamment expressif pour gérer des listes et des hiérarchies de concepts,
  • il permet le multilinguisme,
  • il est assez facile à intégrer aux systèmes d’information et
  • bien adapté pour travailler avec des API,
  • il a gagné une certaine popularité au sein des communautés scientifiques.

SKOS : un standard pour une ressource sémantique simple et FAIR

Dans ce premier volet de la série, découvrez en quoi SKOS peut contribuer à votre démarche de mise en œuvre des principes FAIR. Cette ressource vous propose également une introduction à SKOS.

Accéder à la ressource en ligne : SKOS : un standard pour une ressource sémantique simple et FAIR

Le Thésaurus de la Viande : une ressource sémantique FAIR pour la filière

Le Thésaurus de la Viande ou Meat Thesaurus(1) est le résultat d’un travail mené dans le cadre du WP2 du projet FooSIN qui a apporté son expertise et ses outils à une équipe de chercheurs qui souhaitait disposer d’une version numérisée et enrichie du Dictionnaire de la Viande publié en 2012 par l’Académie de la Viande(2).

Ce thésaurus bilingue français-anglais contient plus de 1500 concepts couvrant différents aspects de la filière viande en France : les animaux de boucherie, l’abattage et les découpes, la commercialisation, les préparations culinaires ainsi que la consommation.  Cette nouvelle ressource reprend les termes et définitions du Dictionnaire de la Viande dans une nouvelle organisation hiérarchique en 12 branches complétée par des relations associatives.

Extrait du Thésaurus de la Viande / Meat Thésaurus (vue française)

Les usagers de ce thésaurus peuvent donc avoir des profils différents : les professionnels de la filière, les chercheurs, les journalistes, les étudiants ou alors les simples consommateurs voulant s’enquérir des spécificités françaises de la filière viande. Conçu dans une démarche de Science Ouverte, le thésaurus peut être utilisé par des applications informatiques pour indexer ou annoter des objets numériques (documents et des jeux de données par exemple), faire de la fouille texte, de la traduction automatique, etc. Sa représentation suit le standard SKOS (Simple Knowledge Organization Systems), les principes FAIR(3) et est librement réutilisable. Le thésaurus est disponible à la consultation et au téléchargement sur Agroportal  (http://agroportal.lirmm.fr/ontologies/MEAT-T)

Deux articles publiés récemment en français dans la revue Viandes et Produits Carnés(4) et en anglais dans la revue Meat Science(5) expliquent la démarche des auteurs et la méthodologie mise en place, et présentent le contenu du Thésaurus de la Viande. Le thésaurus a également été présenté à la communauté des chercheurs et professionnels de la Viande lors de colloques.

Du dictionnaire au format Word vers le thésaurus en SKOS, étape de transformation et de structuration

Cette réalisation du projet FooSIN s’inscrit dans ses actions pour faciliter la production et le partage de ressources sémantiques FAIR. Les données issues du Dictionnaire de la Viande ont été utilisées pour réaliser un comparatif de 3 outils de transformation de vocabulaires au format tabulé vers le standard SKOS (Lire l’article).

Références

  1. Kombolo, Moise; Hocquette, Jean-François; Landrieu, François; Richon, Brigitte; Aubin, Sophie; Yon, Jérémy, 2022, « Thésaurus de la viande », https://doi.org/10.15454/PB5QXC, Portail Data INRAE, V1
  2. Académie de la viande (2012). Dictionnaire de la viande. Publisher, Autres voix. ISBN, 540 2918237086, 9782918237082
  3. SKOS : un standard pour une ressource sémantique simple et FAIR, projet FooSIN, 2022. https://vocabulaires-ouverts.inrae.fr/skos-un-standard-pour-une-ressource-semantique-simple-et-fair/
  4. Moise Kombolo, Jérémy Yon, François Landrieu, Brigitte Richon, Sophie Aubin, Jean-François Hocquette, 2022, Le Thésaurus de la viande : un nouvel outil accessible à tous VPC-2022-3814 https://www.viandesetproduitscarnes.fr/index.php/process-et-technologies/6-le-thesaurus-de-la-viande-un-nouvel-outil-accessible-a-tous
  5. Kombolo, M., Yon, J., Landrieu, F., Richon, B., Aubin, S., & Hocquette, J.-F. (2022). A new semantic resource responding to the principles of open science: The meat thesaurus as an IT tool for dialogue between sector actors. In Meat Science (p. 108849). Elsevier BV. https://doi.org/10.1016/j.meatsci.2022.108849

Rapport FooSIN sur les formations en relation avec les principes FAIR

Le rapport sur les formations FAIR (D3.1) réalisé dans le cadre du projet FooSIN est disponible (https://hal.inrae.fr/hal-03260886). Les résultats (47 enregistrements) proviennent d’une enquête menée au second semestre 2020 auprès des organisations partenaires du projet, complétée par une recherche sur Internet. Le rapport identifie les actions de formation en rapport avec les principes FAIR et met en lumière les sujets peu ou pas traité, à savoir :

  • Nettoyage des données,
  • Web sémantique, linked data,
  • Ontologies, vocabulaires,
  • Implémentation des principes dans un domaine particulier,
  • Open source (forges logicielles),
  • Services web, API.

Classement des sujets selon leur nombre d’occurrences sur l’ensemble des formations

L’étude s’intéresse à d’autres aspects : généricité vs spécificité au domaine, modalité et durée des formations, langue, niveau des pré-requis et type de contenu. En savoir plus.

 

De TermSciences à Loterre : comment l’Inist-CNRS a rendu les terminologies ouvertes plus conformes aux principes FAIR

>> GO CHANGE : 1er cas d’étude FooSIN autour de 2 portails terminologiques

Nous demandons à des acteurs de la communauté scientifique dans les domaines de l’agriculture et l’agro-alimentaire de partager leur retour d’expérience des pratiques FAIR sur des cas d’étude portant sur des jeux de données, bases de données, ressources sémantiques, logiciels, services, etc.

Les portails terminologiques TermSciences et Loterre exposent des terminologies produites par l’Inra (aujourd’hui INRAE) potentiellement intéressantes pour annoter ou documenter des données. Nous avons voulu savoir quels avancées apporte Loterre vis-à-vis de TermSciences en les considérant sous le prisme des principes FAIR.

Lisez l’interview sur notre site ou téléchargez le document sur HAL.

Nous remercions les concepteurs et administrateurs de TermSciences et Loterre de nous avoir ouvert leurs portails et de s’être prêtés à l’exercice d’analyse de leur adhérence aux principes FAIR.

Majid Khayari, Véronique Reszetko, Dominique Vachez, Nathalie Vedovotto, Jérémy Yon, et al.. De TermSciences à Loterre : comment l’Inist-CNRS a rendu les terminologies ouvertes plus conformes aux principes FAIR. 2021, ⟨10.15454/djh8-yp20⟩⟨hal-03176063⟩

C’est ‘oui’ pour une liste de diffusion francophone autour des principes FAIR

Les résultats du sondage lancé par FooSIN fin mars nous encouragent à lancer la création d’une liste de diffusion et de partage autour des principes FAIR pour la communauté francophone. Pour assurer une complémentarité avec des listes existantes sur la gestion et le partage des données, la liste FAIR devra aborder plus spécifiquement les aspects techniques de l’implémentation des principes FAIR.

Merci aux 161 personnes qui ont répondu à notre enquête et aux personnes qui l’ont relayé dans leurs réseaux. Notre analyse des résultats est la suivante :

  • aucune liste spécifique aux principes FAIR n’a été identifiée. Des listes plus généralistes sur les données comme donnees-inter-reseaux@services.cnrs.fr ou rda-france@services.cnrs.fr ont cependant été mentionnées par 5 personnes.
  • un nombre suffisant de personnes intéressées semble atteint pour démarrer la liste. Par ailleurs, la diversité des organisations représentées (CIRAD, Cnrs, GO FAIR, IFB, INRAE, INSA, Instituts Agro, IFV, IRD, Oniris, +10 Universités,  Sciences Po, acteurs privés…) permettra d’étendre rapidement ce premier cercle.

Seriez-vous intéressé(e) par la création d’une telle liste ?

En savoir plus