Loading AI tools
recommandation du W3C pour représenter des thésaurus documentaire, classifications ou d'autres types de vocabulaires contrôlés ou de langages documentaires De Wikipédia, l'encyclopédie libre
SKOS ou Simple Knowledge Organization System (« système simple d'organisation des connaissances ») est une recommandation du W3C publiée le pour représenter des thésaurus documentaire, classifications ou d'autres types de vocabulaires contrôlés ou de langages documentaires. S'appuyant sur le modèle de données RDF, son principal objectif est de permettre la publication facile de vocabulaires structurés pour leur utilisation dans le cadre du Web sémantique.
Le développement de SKOS a impliqué des acteurs à la fois de la communauté RDF et des experts en Science de l'information. SKOS cherche à être le plus compatible possible avec les standards tels ceux des thésaurus, monolingues ou multilingues[1].
Les représentations conceptuelles réalisées à l'aide de SKOS peuvent être utilisées par des systèmes d'information fermés, mais aussi, dans la perspective du Web sémantique, être publiés sur le Web et alignées avec d'autres systèmes d'organisation de connaissances, de façon à rendre ces différents langages plus interopérables.
SKOS a d'abord été un produit du projet SWAD-Europe[2], un projet financé par la Communauté européenne, dans le cadre du programme Technologies de la Société de l'Information[3]. Le projet avait pour but de soutenir l'activité Web sémantique du W3C. Les premières publications de « SKOS core » et « SKOS mapping » datent de 2003, parmi d'autres livrables concernant par exemple l'encodage RDF des thésaurus multilingues[4] et les correspondances entre thésaurus[5].
À la fin du projet SWAD-Europe, le travail sur SKOS a été relayé par l'activité web sémantique du W3C[6] dans le cadre d'un groupe de travail sur les bonnes pratiques et le déploiement des standards RDF[7]. Pendant cette période, l'effort a porté sur la consolidation du noyau de SKOS, et le développement de conseils pratiques pour la migration et la publication de vocabulaires existants dans ce format.
Différents documents de travail ont été publiés pendant cette période dont on peut retrouver trace sur le site officiel de SKOS à la rubrique Historique des travaux du groupe de travail W3C SKOS[8]. Le mandat du groupe de travail a été étendu de mai 2006 à avril 2008 avec comme objectif d'atteindre le statut de Recommandation W3C[9].
Différentes versions de travail du document de référence ont été publiées entre 2005 et 2008 pour aboutir en , au document ayant statut de recommandation W3C[10]. Un document de travail SKOS Primer[11], est proposé en accompagnement du document de référence.
SKOS définit les classes et propriétés suffisantes à la représentation des thésaurus standards, c'est-à-dire des listes de termes d'un domaine centré sur la présentation des relations linguistiques entre les différents termes de ce domaine. Conformément au point de vue « concept-centrique » du vocabulaire caractéristique de RDF, les objets primitifs ne sont pas des termes linguistiques, mais des concepts abstraits. Les termes les dénotant dans les différents langages deviennent dans ce formalisme des propriétés de ces concepts.
Un « concept SKOS » est ainsi défini comme une ressource RDF, donc identifiée par une URI.
À chaque concept peuvent être attachés des propriétés RDF :
Les concepts peuvent être regroupés dans des « schémas de concepts » (ou « agrégations de concepts »), qui représentent un thésaurus ou une nomenclature entière. Par ailleurs les schémas de concepts peuvent contenir, outre des concepts, des objets de type « Collection », permettant de regrouper un sous-ensemble de concepts. Les Collections SKOS répondent à deux cas d'usage : la séparation d'un thésaurus en sous-parties (micro-thésaurus), ou la gestion des « facettes » dans un thésaurus.
Les propriétés d'alignement proposées dans SKOS[12] permettent d'exprimer des correspondances (exactes ou approximatives) entre concepts provenant de systèmes d'organisation de connaissances différents.
Les applications gérant des structures de concepts peuvent comparer les concepts et déclarer une relation d'équivalence entre deux concepts. Le schéma distingue une identité exacte skos:exactMatch (ex. : ex1:personne skos:exactMatch ex2:être humain) ou proche skos:closeMatch. Si la correspondance et la relation sont plus complexes, celles-ci sont exprimables par l'emploi des autres relations skos:broadMatch, skos:narrowMatch, skos:relatedMatch.
SKOS-XL est un appendice de la recommandation SKOS permettant de décrire les termes comme des ressources à part entière. Là où SKOS seul permet d'exprimer des propriétés et des relations au niveau de concepts abstraits, SKOS-XL permet d'exprimer des assertions et des relations entre termes, du type <FAO> <est l'acronyme de> <Food and Agriculture Organization>. L'utilisation de SKOS-XL reste facultative.
Élémentairement, SKOS est conçu pour décrire une ressource conceptuelle en énumérant les caractéristiques de chacun des concepts qu'elle comporte : le concept[13] prend rang de sujet du triplet RDF et est déclaré comme concept par la valeur donnée à rdf:type : skos:Concept, comme dans l'exemple : <http://www.example.com/encyclopédie> rdf:type skos:Concept.
Le concept, une fois caractérisé comme tel, est associé à au moins une chaîne de caractère lexicale[14] le désignant dans le contexte d'utilisation ; des termes alternatifs (synonymes, cacographie) complètent cette description linguistique (attributs : skos:prefLabel, skos:altLabel et skos:hiddenLabel).
Une fois un concept décrit par ces premiers attributs, il est explicité par ses relations à d'autres concepts à l'aide de la propriété skos:semanticRelation[15] et ses propriétés dérivées. De la même manière qu'au niveau des attributs précisant les termes, ces propriétés sont particulièrement prévues pour représenter les relations sémantiques au cœur des thésaurus (hiérarchiques avec skos:broader et skos:narrower, et non-hiérarchiques avec skos:related).
Ensuite, la propriété skos:note[16] et ses dérivées autorisent les compléments d'information rencontrés dans les thésaurus (note d'application, définition, note historique ou éditoriale, etc.).
Deux autres propriétés permettent au besoin comme dans le cas des thésaurus, de décrire et d'organiser l'ensemble des concepts décrits en une structure de concepts skos:ConceptScheme[17] caractérisant la ressource comme une structure dont les concepts majeurs seront repérés à l'aide de skos:hasTopConcept.
Des collections de concepts[18] permettent de regrouper des concepts, d'établir des listes (skos:memberList) composés de membres (skos:member), voire de les ordonner (skos:OrderedCollections).
Les vocabulaires SKOS sont conçus pour être intégrés dans des environnements sémantiques utilisant d'autres vocabulaires RDF, comme le langage d'ontologie OWL. Ce dernier est conçu pour exprimer des structures conceptuelles complexes et riches (ontologies) supportant des fonctions logiques de contrôle de cohérence ou d'inférence. Toutefois, construire des ontologies utiles est un effort coûteux nécessitant un niveau d'expertise élevé. Dans beaucoup de cas où un tel effort est impossible ou inadapté, SKOS propose une voie économique et moins difficile de transition vers les technologies sémantiques. L'extensibilité inhérente à RDF rend possible une extension ultérieure ou une intégration des vocabulaires SKOS à des vocabulaires plus complexes, y compris des ontologies OWL.
Le document SKOS Reference[19] définit la classe skos:Concept comme une classe OWL (skos:Concept rdf:type owl:Class). OWL apparait donc comme le méta-modèle dans lequel sont définies les classes et propriétés du langage SKOS, et une instance de skos:Concept est, au sens de OWL, un « Individual ». C'est une distinction essentielle entre une structure de concepts et une ontologie. La structure est destinée avant tout à faciliter une circulation cohérente dans un domaine et ses dimensions, alors que l'ontologie inventorie les types d'éléments (classes) qui peuvent y être rencontrés en fournissant de surcroît des informations sur les éléments individuels possibles (instances). Aussi, compte tenu de la proximité des moyens mis en œuvre (triplets RDF ; termes identiques ; hiérarchies homologues ; graphes ; etc.) dans les deux cas, il est important de limiter la confusion entre les deux modèles de données, chacun pouvant être légitimement exploité pour ses caractéristiques propres au sein d'une application mixte.
Des vocabulaires de référence ont été migrés au format SKOS et sont disponibles au public.
Avec SKOS, il est possible d'intégrer un thésaurus à un système d'information, au point de le rendre invisible aux utilisateurs. L'utilisateur bénéficie ainsi d'une assistance sémantique à la recherche syntaxique dans la base documentaire par une interface entre le vocabulaire utilisateur et le vocabulaire spécialisé (vocabulaire métier). Une mise en œuvre possible consiste à proposer de façon itérative les concepts clés du thésaurus SKOS en réponse aux mots clés choisis par l'utilisateur, éventuellement dans d'autres langues que la sienne ; une liste de mots clés affinée est ensuite soumise au système de recherche syntaxique[28].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.