Famille :

Les concours de la FPT


Dernière mise à jour : novembre 2015

L’indexation permet d’effectuer une recherche dans un ou plusieurs instruments de recherche sans les parcourir de manière linéaire. En interrogeant une base de données ou un index papier, le chercheur doit obtenir rapidement des informations précises et pertinentes : cote, analyse, dates. Son intérêt principal est de permettre l’accès à une information par des interrogations croisées combinant différentes zones de description (mots-matières, noms propres, dates…).

1. Définitions et notions

Indexation : opération destinée à représenter, par les éléments d'un langage documentaire ou naturel, des données résultant de l'analyse du contenu d'un document.

Langage documentaire : langage artificiel constitué de notions et de relations entre ces notions, dont la finalité est de formaliser les informations contenues dans les documents par le biais d’index servant pour la recherche documentaire.

Index : liste alphabétique des termes, en général des noms de personnes physiques ou morales, de lieux ou de matières relevés dans des documents d'archives ou dans un instrument de recherche, assortis des références correspondantes (cote ou numéro de page) destinées à retrouver les occurrences de ces termes.

Descripteur : mot-clé retenu dans un lexique ou un thésaurus pour indexer une notion apparaissant dans une analyse ou un document.

Thésaurus : liste contrôlée de descripteurs reliés entre eux par des relations sémantiques, hiérarchisées, associatives ou d’équivalence, servant à indexer les notions d'une unité de description.

Liste d’autorités : instrument de gestion et de normalisation contenant la liste des mots-clés ou des termes qui doivent être employés dans les opérations de description et d’indexation, les autres faisant l’objet de renvois d’équivalence.

Silence documentaire : lorsqu’une base de données ou un index ne fournit aucun ou peu de résultats à la suite d'une requête. Ce silence peut être la conséquence d'une base inadaptée à la demande ou résulter d'une erreur de formulation de la requête.

Bruit documentaire : on parle de bruit documentaire lorsque les résultats retournés par l'outil de recherche viennent parasiter l'activité et retarder l'obtention de la réponse soit par le trop grand nombre de ces résultats, soit par leur faible qualité. La non-pertinence des résultats peut avoir deux causes distinctes : une indexation déficiente ou erronée des documents, ou une requête maladroite opérée par l'utilisateur.

2. Utilité de l’indexation

L’indexation ne porte pas directement sur le contenu des documents, mais sur les descriptions associées aux documents : c’est l’analyse archivistique qui sert de support à l’indexation. « C’est une technique documentaire à deux degrés : en effet, seule l’analyse est faite à partir des documents eux-mêmes ; elle sert ensuite de support à la sélection des termes d’indexation. C’est pourquoi, quel que soit le niveau de finesse retenu (groupe de dossiers, dossier ou pièce), l’indexation repose sur une analyse intelligible, fiable et complète, dont elle est le complément » (Source : circulaire AD 94-8 du 5 septembre 1994).

Il s’agit donc d’un mode d’accès complémentaire au mode de classement choisi pour l’instrument de recherche, notamment depuis l’instauration de la cotation en W, puisque la cote est désormais dépourvue d’éléments d’information.

La circulaire AD 94-8 du 5 septembre 1994 relative « au traitement des archives contemporaines, à l’indexation et aux instruments de recherche », définit les différentes notions à indexer, présentes dans tout dossier administratif (et donc, devant figurer dans l'analyse), sont les suivantes :

  • objet concerné ;
  • procédure administrative mise en œuvre ou action ;
  • type de document ou de dossier ;
  • dates ;
  • organismes concernés ;
  • noms géographiques ;
  • noms de personnes.

L'indexation des trois premières notions est encadrée par un thésaurus. Le choix des mots-matières est à faire parmi les descripteurs du thésaurus. Le nombre de descripteurs par analyse n'est pas limité, la justesse de l'indexation résultant précisément de la combinaison des descripteurs.

L’indexation est réalisée manuellement, par l’archiviste, ou de manière automatique grâce à des outils informatiques qui génèrent des listes de mots-clés à partir du texte des instruments de recherche.

3. Utilisation d’un vocabulaire normé

L’indexation, pour être efficace, doit être réalisée à l’aide d’un vocabulaire structuré qui guide le chercheur de manière fiable vers les analyses susceptibles de l’intéresser. Pour cela, les analyses sont décrites au moyen de termes normalisés, sans ambigüité et indépendants du vocabulaire libre utilisé pour rédiger ces analyses archivistiques. Il ne doit y avoir qu’une seule façon de décrire une seule et même chose. Cette normalisation a été rendue possible par la mise en place de thésaurus et listes d’autorités depuis la fin des années 1980.

Le premier thésaurus destiné à instaurer un vocabulaire normalisé d’indexation ou « thésaurus W » a été publié en 1987, et ne concernait alors que les Archives départementales. Il a été remanié et rendu obligatoire, en 1997, pour l’ensemble des services d’archives territoriales. Désormais, il s’intitule « Thésaurus pour la description et l’indexation des archives locales anciennes, modernes et contemporaines ». La dernière version disponible date de 2012 (5e version).

Il contient :

  • un thésaurus-matière, présenté sous forme de liste méthodique (répartition des termes en 11 rubriques) puis sous forme de liste alphabétique. Il s’agit bien des mêmes descripteurs, mais organisés de manière différente pour faciliter le travail de l’archiviste. Les termes contenus dans ce thésaurus-matière sont destinés à l’indexation de l’objet de l’analyse archivistique ;
  • trois listes d’autorités : actions, typologie documentaire, contexte historique.

Devant les descripteurs proposés, on trouve parfois certaines abréviations :

  • TG signifie « terme générique » : indique qu’il existe un terme plus générique pour cette notion ;
  • TS signifie « terme spécifique » : indique qu’il existe un ou des termes plus spécifiques pour cette notion ;
  • TA signifie « terme associé » : indique qu’il existe un terme différent, se rapportant au même sujet ;
  • EM signifie « employer » : indique qu’il faut employer un autre descripteur pour exprimer l’objet ;
  • EP signifie « employé pour » : indique que ce descripteur doit être employé à la place d’autres termes.

Seuls les termes en lettres capitales sont des descripteurs. Les autres, en lettres minuscules, sont des « non-descripteurs ».

Exemple 1 :

15_fiche_indexation_def_WKT_html_m481abd7f.png

Extrait de la rubrique 5 de la liste méthodique, qui concerne l’éducation et les sciences.

(Source : Thésaurus pour la description et l’indexation des archives locales anciennes, modernes et contemporaines)

Un archiviste souhaite indexer l’instrument de recherche des archives versées par une association qui dispense des cours de français :

  • il pourra utiliser le descripteur « enseignement », de la rubrique 5.1. Le thésaurus précise que ce descripteur possède un terme associé, « alphabétisation », que l’on trouve à la rubrique 10.4. ;
  • s’il veut indexer la notion de manuel scolaire, le thésaurus indique qu’il devra utiliser le terme « matériel pédagogique », manuel scolaire n’étant pas un descripteur.

Exemple 2 :

15_fiche_indexation_def_WKT_html_ddad08.png

Extrait de la liste alphabétique, lettre A

(Source : Thésaurus pour la description et l’indexation des archives locales anciennes, modernes et contemporaines)

Si l’archiviste souhaite indexer un instrument de recherche qui concerne un agent municipal de l’Ancien Régime, il ne pourra pas employer le terme « agent municipal d’ancien régime », qui n’est pas un descripteur. Le thésaurus indique qu’il faut employer « fonctionnaire territorial ». Pour être plus précis, l’archiviste associera lors de son indexation, au descripteur matière « fonctionnaire territorial » dans le champ réservé au contexte historique, l’autorité « monarchie d’ancien régime ».

15_fiche_indexation_def_WKT_html_m5fda59ec.png

Extrait de la liste la liste d’autorités contexte historique

(Source : Thésaurus pour la description et l’indexation des archives locales anciennes, modernes et contemporaines)

L’archiviste qui indexe doit obligatoirement utiliser les descripteurs du thésaurus et les listes d’autorité : il utilise un vocabulaire normé et surtout, réduit. Il lui faut combiner les termes. La difficulté pour le chercheur sera alors d’adopter cette logique de vocabulaire normé et d’association de termes lors de l’interrogation de l’index. Les bases de données permettent d’effectuer des interrogations en associant ou en excluant des termes (et/ou/sauf).

L’utilisation d’expressions combinées permet une meilleure précision de la requête mais peut également produire du silence documentaire lors de l’interrogation. A l’inverse, le recours à des termes trop simples donne du bruit (trop de réponses non pertinentes). Au moment de l’indexation il convient donc d’associer plusieurs descripteurs simples pour traduire des notions plus complexes.

4. Le niveau d’indexation

De la même façon que différents niveaux de description existent lorsqu’on traite un fonds, différents niveaux d'indexation sont possibles, du général au particulier :

  • le niveau du sommaire du versement, où l'on indexe des groupes d'articles homogènes ;
  • le niveau de l'article.

Il faut adapter le niveau de détail de l’indexation au niveau de description de l’analyse c’est à dire, ne pas indexer trop finement au niveau d’un fonds ou d’un sous-fonds, et inversement, ne pas indexer de façon trop générale au niveau des articles dont l’analyse est très précise.

Si l’on décide d’indexer un versement au niveau de l’article, il faut le faire pour l’intégralité des articles. Si l’on décide, pour des dossiers de personnel par exemple, d’indexer le nom de l’agent, il faut le faire pour l’intégralité des dossiers. Sans cela, les résultats de l’interrogation de l’index seraient faussés.

5. Points à retenir

  • L’indexation ne remplace pas l’analyse archivistique. Elle la complète, en résumant son contenu, à l’aide d’un vocabulaire normalisé et limité.
  • L’indexation ne dispense pas le lecteur de consulter les instruments de recherche. C’est un outil d’orientation.

Pour en savoir plus

Le thésaurus pour la description et l’indexation des archives […] est disponible sur le site du SIAF : http://www.archivesdefrance.culture.gouv.fr/gerer/classement/normes-outils/thesaurus/

Les circulaires du SIAF : http://www.archivesdefrance.culture.gouv.fr/gerer/ :

  • Circulaire AD 63-31 du 22 juillet 1963. Index alphabétiques des fonds d’archives et de leurs inventaires, annulée et remplacée par la note d’information DITN/RES/2007/008 du 30 juillet 2007.
  • Circulaire AD 94-8 du du 5 septembre 1994, définit les modalités pratiques de l’indexation en s’appuyant sur différentes normes, complétée et réactualisée par la note d’information DITN/RES/2007/008.

Les normes ISO sur l’indexation et les thesaurus monolingues et multilingues :

  • ISO 999:1996 (novembre 1996) Information et documentation. Principes directeurs pour l’élaboration, la structure et la présentation des index
  • ISO 2788 (1986) Principes directeurs pour l’établissement et le développement de thésaurus monolingues
  • ISO 5964 (1985) Principes directeurs pour l’établissement et le développement de thésaurus multilingues

Elles peuvent être achetées sur le site https://www.iso.org/obp/ui/fr/#iso:std:5446:fr

Le thesaurus Priam 3 s’applique aux documents conservés par les Archives nationales à Fontainebleau et transférés par les missions des Archives nationales établies dans les différents ministères. La base est disponible à l’adresse suivante : http://www.culture.gouv.fr/public/mistral/priam3_fr

Auteur :

PINTAULT Mathilde

Thématique(s) :

Groupe :

Concours de la FPT

Tags:
Créé le 29 mai 2019
 

Accès thématique

Accès famille

© 2017 CNFPT