Skip to main content

Gedcom (page brute) = définition et grammaire

Le mot Gedcom désigne un format développé à l'origine par l'Église des Mormons pour des raisons religieuses, ensuite récupéré par les généalogistes pour devenir un standard international des échange de données entre divers systèmes et divers logiciels.

Une information Remarques

1. Le mot Gedcom, qui est un acronyme de genealogical data communication (communication de données généalogiques), s'écrit parfois comme un sigle : GEDCOM.

2. Par dérivation métonymique, le mot désigne également un fichier de généalogie au format Gedcom. Donc, le fichier xxxxx.ged sur lequel vous travaillez dans Ancestris, est un Gedcom.


Depuis le milieu des années 90, avec l'avènement d'Internet et la multiplication des échanges numériques, la spécification Gedcom est progressivement devenue une norme incontournable pour la plupart des logiciels et sites de généalogie. Cependant, certains d'entre eux ne respectent pas totalement le format et adaptent celui-ci en développant des commandes propriétaires. Ancestris quant à lui est totalement compatible Gedcom (version 5.5 et 5.5.1), ce qui signifie qu'il permet à ses utilisateurs d'échanger et partager des fichiers de généalogie parfaitement fiables, sans risque de pertes de données.

 

Sommaire

Caractéristiques d'un fichier Gedcom

Un fichier au format Gedcom est un fichier texte (*.ged), c'est-à-dire un fichier pouvant être ouvert (pour consultation ou modification) depuis n'importe quel éditeur de texte (tel que Notepad, Kate, Kwrite, Gedit, etc.) Par voie de conséquence, un tel fichier peut être utilisé tel quel par n'importe quel logiciel de généalogie, installé sous n'importe quel système d'exploitation, sans avoir besoin de convertir quoi que ce soit.

Les différentes informations contenues dans le fichier Gedcom sont précédées d'un tag (ou étiquette, ou label, ou identificateur) : dans la norme Gedcom, ce tag est un marqueur composé de trois ou quatre lettres capitales, toujours associé au même type d'information.

  • Par exemple, le tag PLAC (= place, c'est-à-dire, lieu, endroit) indique toujours que l'information qu'il annonce est un lieu (lieu de naissance, lieu de décès, lieu d'une cérémonie, etc.)

 

Enregistrements d'un fichier Gedcom

Une information Remarque
Le mot enregistrement ne doit pas induire en erreur ici. En effet, concernant la structure d'un fichier Gedcom, le mot ne désigne pas le simple fait d'enregistrer, mais plutôt le module élémentaire réunissant un ensemble d'informations (à l'instar du sens qu'il revêt dans le domaine des bases de données).


Un fichier Gedcom contient un ensemble d'enregistrements, dont le premier et le dernier sont d'un type particulier :

  • Le premier enregistrement s'appelle l'en-tête (tag HEAD) ;
  • Le dernier enregistrement s'appelle le marqueur de fin de fichier (tag TRLR).

Chacun des autres enregistrements appartient à une catégorie d'entité, étant bien entendu que chacune de ces catégories possède ses fonctions et ses structures propres.

Un fichier Gedcom peut donc contenir :

  • Un certain nombre d'enregistrements appartenant à la catégorie des individus (tag INDI) ;
  • Un certain nombre d'enregistrements appartenant à la catégorie des familles (tag FAM) ;
  • Un certain nombre d'enregistrements appartenant à la catégorie des notes (tag NOTE) ;
  • Un certain nombre d'enregistrements appartenant à la catégorie des sources (tag SOUR) ;
  • Un certain nombre d'enregistrements appartenant à la catégorie des dépôts (tag REPO) ;
  • Un certain nombre d'enregistrements appartenant à la catégorie des fichiers multimédias (tag OBJE) ;
  • Un certain nombre d'enregistrements appartenant à la catégorie des fournisseurs d'informations (tag SUBM).

 

Organisation arborescente d'un enregistrement

Chaque enregistrement se présente de manière arborescente : chaque tag peut comprendre un nombre quelconque de sous-tags (des tags, hiérarchiquement dépendants du tag de niveau immédiatement supérieur, et susceptibles de comprendre à leur tour un ou plusieurs sous-tags, etc.) Chaque niveau peut ainsi se subdiviser à l'infini.

 

Niveaux hiérarchiques

Comme chaque ligne doit rester impérativement à sa place du point de vue de la hiérarchie, chacune d'elles est affectée d'un numéro correspondant au niveau qu'elle occupe dans l'arborescence de l'enregistrement.

C'est ainsi que la ligne du niveau principal de chaque enregistrement (c'est-à-dire le niveau zéro) porte le numéro 0 ; une ligne située au niveau immédiatement inférieur porte le numéro 1 ; une ligne située au niveau immédiatement inférieur au niveau précédent porte le numéro 2 ; et ainsi de suite.

Le niveau zéro de chaque enregistrement (autre que les deux enregistrements extrêmes, HEAD et TRLR) est composé de deux éléments accolés :

  • Le numéro ID de l'entité encadré de deux arobases (@),
  • Le tag associé à la catégorie à laquelle appartient l'entité en question.
    • Par exemple, l'en-tête @I24@INDI signifie que l'enregistrement a pour numéro ID le I24, et qu'il appartient à la catégorie des individus (autrement dit, individu numéro I24).

 

Indentation

Pour plus de clarté, les différentes lignes d'un enregistrement peuvent être indentées (affectées d'un ou plusieurs espaces à gauche du premier caractère), de manière à repérer plus facilement la place qu'occupe chacune d'elles dans la hiérarchie.

  • Exemple non indenté :
0 @I3@ INDI (tag principal de cet enregistrement : individu I3)
1 NAME Jean Martin (nom de l'individu)
1 SEX M (sexe de l'individu : masculin)
1 BIRT (naissance de l'individu)
2 DATE 16 avril 1951 (date : 16 avril 1951)
1 FAMC @F5@ (famille dont descend l'individu I3 : famille F5)
  • Le même exemple indenté :
0 @I3@ INDI (tag principal de cet enregistrement : individu I3)
  1 NAME Jean Martin (nom de l'individu)
  1 SEX M (sexe de l'individu : masculin)
  1 BIRT (naissance de l'individu)
    2 DATE 16 avril 1951 (date : 16 avril 1951)
  1 FAMC @F5@ (famille dont descend l'individu I3 : famille F5)

L'éditeur Gedcom d'Ancestris adopte un affichage indenté, mais ne fait pas apparaître les numéros de niveau. Il ajoute en outre des poignées permettant d'afficher ou de masquer les sous-tags de telle ou telle branche.

  • Le même exemple indenté, mais sans les numéraux de niveaux :
@I3@ INDI (tag principal de cet enregistrement : individu I3)
  NAME Jean Martin (nom de l'individu)
  SEX M (sexe de l'individu : masculin)
  BIRT (naissance de l'individu)
    DATE 16 avril 1951 (date : 16 avril 1951)
  FAMC @F5@ (famille dont descend l'individu I3 : famille F5)

 

Composition d'une ligne dans un enregistrement

Ligne standard

Chaque ligne d'un enregistrement contient essentiellement les éléments suivants et se termine par un retour de chariot (touche <Entrée>) :

  • Le numéro de niveau (de 0 à n),
  • Le tag indiquant la nature des informations contenues sur la ligne,
  • Les informations associées au tag en question.

Exemple :

  • La ligne 2 DATE 16 avril 1951 peut se lire ainsi : ligne de niveau 2, tag DATE, information : 16 avril 1951

 

Référence

Certaines lignes contiennent en outre une référence, laquelle consiste en un numéro encadré par deux arobases (@). Cette référence constitue un marqueur spécial dont le rôle est différent selon la place qu'il occupe par rapport au tag de la ligne.

  • Une référence située à gauche du tag indique le numéro de l'enregistrement courant (numéro toujours unique dans la catégorie d'entité dont il relève) : ce cas de figure ne se produit que sur la ligne de niveau 0 de l'enregistrement. Exemple :
    • 0 @I3@ INDI : ligne principale de l'entité faisant l'objet de cet enregistrement, numéro ID de cet enregistrement : I3, catégorie d'entité : individu.
  • Une référence située à droite du tag, indique le numéro d'un autre enregistrement, et renvoie à ce dernier afin de le mettre en relation avec l'enregistrement courant. Exemple :
    • 1 FAMC @F5@ : ligne de niveau 1, tag FAMC (famille dont descend l'individu courant) et référence F5 (autrement dit : l'individu courant descend de la famille F5)

 

Différentes versions de la norme Gedcom

La norme "Gedcom", c'est quoi ?

Il est important de savoir ce qu'est la norme Gedcom. Vous trouverez en bas de page divers liens sur les fichiers html qui rassemblent l'ensemble de la documentation : certains textes sont en anglais, désolé [1].

Nous vous proposons une traduction des points essentiels de la norme et leur utilisation dans Ancestris (d'autres liens, en fin d'article, vous permettront de mieux comprendre cette norme ; traduction et explications sur d'autres sites).

 

Norme Gedcom 5.5

Tables des matières

Lettre de William S. Harten
Tableau type des données - Page 1 - Page 2
Introduction


Chapter 1: Grammaire de la Représentation des données

Chapter 2: Grammaire Liée à la Parenté (En français sur ce wiki Grammaire Gedcom.)

Chapter 3: Utilisation des jeux de caractères dans GEDCOM

Chapter 4: Enregistrement de la Production GEDCOM
Appendice A : Définition du Tag Gedcom Lié à la Parenté (En français sur ce wiki : Définition des tags)
Appendice B : Références Croisées

Appendice C : Codes LDS Temple
Appendice D : Jeu de Caractères ANSEL

Appendie E : Encoder/Décoder Objets Multimedia

 

Norme Gedcom 5.5.1

Vous pouvez aussi consulter la norme Gedcom 5.5.1 :
Norme Gedcom 5.5.1 (fichier pdf en anglais).

 


 

Liens externes