Loading AI tools
De Wikipédia, l'encyclopédie libre
Les bases de données bibliographiques répertorient toute catégorie d'objets bibliographiques livres, collections, revues, articles de revues grâce à leurs métadonnées telles que leur titre, auteur, résumé, descripteur sujet. Elles sont le fruit de l'informatisation des catalogues de bibliothèque, et permettent des recherches à l'aide de mots-clefs ainsi que l'analyse des données (bibliométrie, etc.). WorldCat est l'exemple d'une telle base de données.
Les bases bibliographiques ou plus précisément les bases de références bibliographiques se créent à partir des années 1960[1].
Dans les années 1960-1970, le terme banque de données est privilégié. Il désigne alors des bases, à l'époque fréquemment de références bibliographiques, relatives « à un domaine défini de connaissances et organisé[ées] pour être offert aux consultations d'utilisateurs »[2],[3]. Ce terme permettait de distinguer ces systèmes documentaires des logiciels eux-mêmes ou systèmes de gestion de base de données (SGBD).
Les bases de données bibliographiques évoluent, en particulier depuis les années 2000, selon deux axes qui peuvent se combiner :
Le terme base de données utilisé ici doit être compris avec précaution. En effet, il s'agit plutôt d'une collection de données ou de notices bibliographiques. Cette structure apparemment simple peut cacher des facteurs de complexité.
La structure des enregistrements peut être relativement élémentaire (simple collection de champs), plus complexe avec des formats MARC (ou conformes à la norme ISO 2709), et maintenant d'une structure quelconque avec XML.
Par rapport aux bases de données relationnelles, un facteur de complexité vient de l'impossibilité de figer la taille des données. Pratiquement tous les champs sont de longueur variable avec des facteurs de répétition pouvant devenir très importants. Par exemple, un nom d'auteur fait en moyenne moins de 10 caractères, mais on trouve des auteurs de plus de 100 caractères. Un article scientifique possède en moyenne 2 ou 3 auteurs mais on peut trouver des articles de physique avec 500 auteurs.
De nombreuses bases de données bibliographiques contiennent des informations décrivant le contenu à l'aide d'une liste de termes d'indexation ou mots-clés. Ces mots-clés appartiennent souvent à des référentiels terminologiques dont la nature est variable : simple liste de mots contrôlés, plan de classement, thésaurus documentaire ou ontologie.
Outre l'indexation, de nombreuses données peuvent se référer à des référentiels spécialisés, comme les titres de périodique ou les affiliations.
Enfin certaines bases codifient également les références de la bibliographie des articles traités, comme le Science Citation Index, et la base bibliographique devient alors son propre référentiel.
Les bases bibliographiques sont également définies en fonction des thématiques choisies. Elles peuvent influencer considérablement la structure de la base (par exemple, en sciences de la vie la codification des gènes).
Une base se définit également par sa couverture, ou plus précisément la façon dont la base est constituée. Dans bien des cas (Medline, Pascal) la couverture est définie par un ensemble de revues qui sont systématiquement dépouillées.
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.