LOTERRE - Linked Open TERminology REsources

picto Loterre ?

Loterre ?

Loterre ?

Cliquez sur les questions ci-dessous pour en savoir plus au sujet de Loterre

Présentation de Loterre

Qu’est-ce que Loterre ?

Loterre (acronyme pour Linked open terminology resources) est une plateforme d’exposition et de partage de terminologies scientifiques multidisciplinaires et multilingues.
S’appuyant sur un triplestore, elle se veut conforme aux standards du web des données ouvertes et liées (LOD) ainsi qu’aux principes FAIR, qui visent à rendre les données Faciles à trouver, Accessibles, Interopérables, Réutilisables. 

A qui s’adresse Loterre ?

Les terminologiques disponibles dans Loterre peuvent répondre à des besoins de fouille de texte, d’annotation sémantique, de recherche d’information ou de traduction.
L’accès aux ressources de Loterre est ouvert à tous, l’utilisation ultérieure de chacune d’elle étant liée à la licence qui la régit.

A quoi sert Loterre ?

Loterre donne accès à des ressources terminologiques scientifiques et permet :

  • leur consultation
  • leur interrogation via un moteur de recherche, une interface SPARQL et une API
  • leur téléchargement sous différents formats

Loterre offre également des services en ligne, dont le contenu est détaillé dans le paragraphe « Services proposés dans Loterre » de cette page.

Qui peut exposer une terminologie dans Loterre ?

Le site Loterre n’est pas réservé aux seules ressources terminologiques produites par l’Inist. Il peut offrir ses services d’exposition à d’autres producteurs de données terminologiques qui en feraient la demande via le formulaire de proposition.

Les producteurs intéressés sont invités à prendre connaissance de la Charte de Loterre.

Loterre et données FAIR ?

Les principes FAIR (Findability, Accessibility, Interoperability, Reusability) applicables aux données scientifiques ont été énoncés par Force11 et publiés par Wilkinson et al. en 2016 (The FAIR Guiding Principles for scientific data management and stewardship). Les étapes de la FAIRification ont été explicitées par GO FAIR .

Ces principes forment un guide de bonnes pratiques pour la gestion et la réutilisation des données et des métadonnées par les machines comme par les humains. Cependant, ils ne constituent pas une spécification car ils ne préconisent ni standard, ni technologie, ni format de données particulier.

De plus, les données FAIR ne sont pas obligatoirement « open » et peuvent présenter différents degrés de FAIRisation et/ou d’ouverture. Il ne faut donc pas confondre LOD (basé sur des standards du web sémantique) et FAIR (basé sur des principes) : voir à ce sujet “Cloudy, increasingly FAIR; revisiting the FAIR Data guiding principles for the European Open Science Cloud” (2017)

Les (méta)données terminologiques exposées dans Loterre répondent à l’ensemble des principes FAIR. En effet elles sont :

  • Faciles à trouver : concept associé à un identifiant unique et persistant (URI)
  • Accessibles : protocole d’accès libre et ouvert (http)
  • Interopérables : langage pour le partage et la représentation des connaissances (SKOS)
  • Réutilisables : licence d’utilisation clairement définie (CC ou Etalab)

Elles peuvent également participer à la FAIRisation des (méta)données de la recherche en favorisant leur interopérabilité sémantique (par les concepts des vocabulaires ou des thésaurus).

De même, les services ContrôlerTransformer et Aligner visent à faciliter la création et l’enrichissement de terminologies en format SKOS/RDF-XML selon les pratiques FAIR.

Loterre et les terminologies de l’Inist que la plateforme héberge sont signalées dans le portail FAIRSharing : https://fairsharing.org/collection/Loterre

Loterre et Linked Open Data ?

Loterre se veut conforme aux principes du LOD (Linked Open Data) tels qu’ils ont été présentés en 2006 par le W3C (Tim Berners-Lee) : les ressources terminologiques sont ici considérées comme des ensembles organisés de termes (désignant des concepts) qui sont des jeux de données librement accessibles via les technologies du web sémantique.

Le Linked Data ou « web des données liées » repose sur 4 règles de base :

  1. Identifier chaque ressource (ou chaque concept) par un URI (Uniform Resource Identifier)
  2. Utiliser des URI HTTP (déréférençables) permettant d’accéder à des informations sur ces ressources
  3. Lorsqu’on déréférence un URI, renvoyer sur des données structurées à l’aide de la famille de standards du W3C : modèle (triplets RDF) et langages (SKOS, RDFS, OWL…) pour les décrire ; SPARQL pour les interroger
  4. Relier les concepts (données RDF) appartenant à différents vocabulaires ou terminologies par des alignements via leurs URI, de manière à créer un réseau de liens RDF et découvrir ainsi de nouvelles relations.

En ajoutant des licences ouvertes pour la diffusion et la réutilisation des ressources publiées sur le web, Loterre respecte les règles du « Linked Open Data ».

T. Berners-Lee (2010) a d’autre part proposé un classement progressif des LOD avec 5 étoiles selon les critères suivants :

*  Données librement disponibles sur le web, avec mention d’une licence ouverte

**  Données dans un format structuré, lisible par la machine

***  Formats non propriétaires (CSV, JSON…)

****  Standards ouverts W3C (RDF, XML, SPARQL) et URI comme identifiant de ressource

***** Données reliées à d’autres données RDF via des alignements dans le LOD Cloud

Enfin, les ressources intégrées au triplestore RDF se veulent, autant que possible, conformes aux bonnes pratiques du W3C relatives à la publication de données liées (W3C, 2014).

Toutes les ressources exposées dans Loterre sont compatibles avec ces règles et principes et peuvent être classées 4 ou 5 étoiles :

  • Licence libre (lo) et/ou ouverte (CC BY)
  • Formats standards : SKOS, XML, JSON-LD, CSV
  • URI alignables

 

Services proposés dans Loterre

Quels sont les services proposés dans Loterre ?

Outre le téléchargement des terminologies hébergées, Loterre propose des services destinés à tout producteur de terminologie, qu’il souhaite ou non exposer ses ressources dans Loterre.
Les services Contrôler, Transformer et Aligner visent à faciliter la création et l’enrichissement de terminologies en format SKOS/RDF-XML selon les principes FAIR (Facile à trouver, Accessible, Interopérable, Réutilisable).
n.b. : Les données utilisateurs traitées par ces services ne sont pas conservées par l’Inist-CNRS.

Que permet le service « Télécharger » ?

Le service « Télécharger » permet un téléchargement de l’intégralité du contenu de l’une des ressources exposées dans Loterre, sous différents formats : PDF, CSV ou SKOS/XML.

Dans la plateforme Loterre il est également possible :

Terminologies de Loterre

Comment sont sélectionnées les terminologies exposées dans Loterre ?

Les terminologies proposées par des tiers font l’objet d’un examen fondé sur des critères de qualité et de format. Les propriétaires du site Loterre se réservent le droit d’opérer une modération des propositions reçues. Ils peuvent refuser d’intégrer une terminologie s’ils considèrent qu’elle ne répond pas aux critères qui régissent la plateforme.

Quel est le schéma de données des terminologies exposées dans Loterre ?

Les terminologies intégrées au triplestore sont exprimées selon un modèle de type « SKOS étendu », qui associe au standard SKOS un certain nombre de catégories appartenant à d’autres formats ou langages (SKOS-XL, Dublin Core, Isothes, OWL, RDFS, etc.).

Ontologie de Loterre (cliquer sur l’image pour l’agrandir)

Quelle est la couverture scientifique des terminologies exposées dans Loterre ?

La couverture scientifique des terminologies exposées dans Loterre est multidisciplinaire et doit relever d’un ou plusieurs des domaines scientifiques suivants :

  • Sciences et technologies
    • Mathématiques
      • Algèbre
      • Analyse mathématique
      • Analyse numérique, calcul scientifique
      • Combinatoire, structures ordonnées
      • Géométrie
      • Mathématiques générales
      • Probabilités et statistiques
      • Systèmes dynamiques, analyse globale et analyse sur variétés
      • Théorie des groupes
      • Topologie, variétés et complexes cellulaires
    • Physique
      • Acoustique
      • Cristallographie
      • Électromagnétisme, optique
      • Mécanique des solides, mécanique des fluides, rhéologie
      • Métrologie
      • Physique atomique et moléculaire
      • Physique de l’état condensé
      • Physique des gaz et des plasmas
      • Physique nucléaire
      • Physique théorique, physique quantique, physique statistique, relativité et gravitation
      • Thermodynamique, transferts de chaleur
    • Sciences de la terre et de l’univers
      • Aéronomie, météorologie, climatologie
      • Astronomie
      • Géologie,  géophysique interne
      • Glaciologie
      • Océanographie
    • Chimie
      • Chimie analytique
      • Chimie générale, chimie théorique et chimie physique
      • Chimie minérale (inorganique)
      • Chimie organique
    • Sciences pour l’ingénieur
      • Aéronautique, transports
      • Automatique, recherche opérationnelle
      • Électronique, informatique
      • Énergie, électrotechnique, électro-énergétique
      • Génie chimique, industries chimiques et para-chimiques
      • Génie civil, bâtiment et travaux publics
      • Génie mécanique
      • Métallurgie
      • Technologie des polymères, peinture, bois
      • Télécommunications, théorie et traitement du signal
  • Nanosciences, nanotechnologies
  • Sciences du vivant et environnement
    • Biologie, santé
      • Biologie moléculaire et structurale, biochimie
      • Génétique, génomique, bio-informatique
      • Biologie cellulaire, biologie du développement animal, zoologie, sciences vétérinaires
      • Physiologie, physiopathologie, biologie systémique médicale
      • Neurobiologie
      • Immunologie, microbiologie, virologie, parasitologie
      • Épidémiologie, santé publique, recherche clinique, technologies biomédicales, pharmacologie, toxicologie, médecine
    • Agronomie, écologie, environnement
      • Biologie cellulaire et biologie du développement végétal, botanique
      • Évolution, écologie, biologie des populations
      • Biotechnologies, sciences environnementales, biologie synthétique, agronomie, foresterie, agroalimentaire
  • Sciences humaines et sociales
    • Marchés et organisations
      • Économie
      • Finance, management
    • Normes, institutions et comportements sociaux
      • Droit
      • Science politique
      • Anthropologie et ethnologie
      • Sociologie, démographie
      • Sciences de l’information et de la communication
    • Espace, environnement et sociétés
      • Géographie
      • Aménagement et urbanisme
      • Architecture
    • Esprit humain, langage, éducation
      • Linguistique
      • Psychologie
      • Sciences de l’éducation
      • Sciences et techniques des activités physiques et sportives
    • Langues, textes, arts et cultures
      • Langues et littératures anciennes et françaises, littérature comparée
      • Littératures et langues étrangères, civilisations, cultures et langues régionales
      • Arts
      • Philosophie, sciences des religions, théologie
    • Mondes anciens et contemporains
      • Histoire
      • Histoire de l’art
      • Archéologie
Quels types de licence doivent régir les terminologies exposées ?

Les ressources exposées dans Loterre doivent disposer d’une licence autorisant la mise à disposition et la réutilisation des données, de type :

  • creative commons : http://creativecommons.fr/licences/
  • ODC-By : https://opendatacommons.org/licenses/by/1-0/
  • ODbL : https://opendatacommons.org/licenses/odbl/1.0/
  • Open Licence (Etalab) : https://www.etalab.gouv.fr/licence-ouverte-open-licence
  • PDDL : https://opendatacommons.org/licenses/pddl/1-0/
  • PDM : https://creativecommons.org/publicdomain/mark/1.0/
Quelle est la couverture linguistique des terminologies exposées dans Loterre ?

Les terminologies exposées dans Loterre peuvent :

  • être monolingues, à condition que la langue soit le français ou l’anglais
  • être multilingues, sous réserve que l’une des langues soit le français ou l’anglais

Les possibilités d’affichage et de recherche dans une langue donnée sont liées aux caractéristiques des applicatifs d’exposition/interrogation connectés au triplestore.

Quels types de terminologies sont intégrés dans Loterre ?

Les ressources terminologiques intégrées dans Loterre se veulent, autant que possible, conformes aux bonnes pratiques du W3C relatives à la publication de données liées.
Idéalement, elles doivent respecter les critères alloués aux données « 5 étoiles » : Linked Data – Design Issues

  • Données librement accessibles sur le web (avec mention d’une licence ouverte) ;
  • Données dans un format structuré (lisible par la machine) ;
  • Format non propriétaire (CSV, RDF, …) ;
  • Standards W3C et URI pour identifier chaque ressource ;
  • Données reliées à d’autres données RDF via des alignements.

Schématiquement, elles peuvent être du type :

  • vocabulaires au sens large : glossaires, listes de termes, thésaurus ;
  • taxonomies (plans de classements et similaires).

Les données de type ressources lexicales, ressources d’analyse de contenu ou ontologies ne pourront être intégrées à Loterre que si elles sont converties en format SKOS, ce qui peut entraîner une perte d’informations par rapport au contenu d’origine.

Du point de vue de leur structuration, elles peuvent :

  • présenter une hiérarchie simple, multiple ou ne présenter aucune hiérarchie ;
  • présenter des regroupements (collections, groupes, domaines ou facettes).

Conception de Loterre

Quelle est l’architecture de Loterre ?

L’architecture de Loterre s’appuie sur un triplestore (base de triplets) doté d’un outil de consultation humaine et interrogeable via une interface SPARQL et une API.

Pour offrir à ses utilisateurs un accès aux terminologies, Loterre fait appel à divers outils tiers open-source :

  • un triplestore Apache Jena-Fuseki
  • Skosmos pour permettre la consultation en ligne des ressources (version 1.10)
  • l’API REST de Skosmos pour permettre à un agent logiciel distant d’interroger et de récupérer des données
  • YASGUI et Sparklis pour la formulation de requêtes SPARQL
  • ezArk pour faciliter au besoin l’attribution d’identifiants ARK
Qui a conçu Loterre ?

Loterre a été conçu par l’Inist-CNRS

Une de vos questions est restée sans réponse ? Posez-la en direct, via le formulaire de contact