Skip to main content

Gedcom (STLM)

The word Gedcom designates a genealogical data exchange format.

It was originally developed by the Mormon Church for religious reasons, then retrieved by genealogists to exchange genealogical data between people runnning their genealogy applications on incompatible computer systems.

So Gedcom is a kind of genealogical language.

The word Gedcom, which is an acronym for Genealogical data communication, is spelled like an acronym: GEDCOM. By metonymic derivation, the word also designates a genealogy file in Gedcom format. The xxxxx.ged file you are working on within Ancestris is a Gedcom.

Since the mid-1990s, with the advent of the Internet and the proliferation of digital exchanges, the Gedcom specification has gradually become an essential standard for most genealogy software and sites.

However, while most of them can export in Gedcom format, some of them do not stricktly respect the Gedcom format and make some adaptations by adding proprietary structures or using existing ones for different meanings. In some cases, proprietary data structures cannot be properly converted to the gedcom format and some data might simply not exported.

Ancestris is fully Gedcom compatible (version 5.5 and 5.5.1), which means that it allows its users to exchange and share perfectly reliable and compelte genealogy files, without risk of data loss.

Characteristics of a Gedcom file

A Gedcom file is a text file, i.e. a file containing human readable lines of text, that can be opened and edited using any text editor, such as Notepad, Kate, Kwrite, Gedit, etc. Its extension name is "*.ged".

As a result, such a file can be used *as is* by any genealogy software, installed under any operating system, without any conversion need.

Each line of text starts with a label,number and a label. The label is called a "tag". This tag is made up of three or four capital letters. It defines the type of information that follows on the line.

  • For example, the tag PLAC (= place) always indicates that the text that follows this tag is a place (such as place of birth, place of death, place of a ceremony, etc.)

    Records of a Gedcom file

    Un fichierA Gedcom contientfile uncontains ensemblea d'enregistrements,set dontof lerecords. premierA etrecord leis derniera sontgroup d'unof text lines, the first one of which starts with a zero "0". A record defines something in particular, which depends on the type particulierof :record.

    The first and the last record of a Gedcom file are of a particular type:

    • LeThe premierfirst enregistrementrecord s'appelleis l'en-têtecalled the header (tagHEAD HEAD) ;tag) and defines some general information about the file.
    • LeThe dernierlast enregistrementrecord s'appelleis lecalled marqueurthe deend finof defile fichiertrailer marker (tagTRLR TRLR)tag). It defines the end of the file.

    ChacunEach desof autresthe enregistrementsother appartientrecords àdefines unea catégoriegenealogical d'entité,entity, étantwith bienits entenduown queset chacuneof de ces catégories possède ses fonctions et ses structures propres.tags.

    Un fichierA Gedcom contientfile uses 7 catégoriesentity d'entité.categories. LesThe enregistrementsrecords qu'onthat peutcan trouverbe dansfound unin fichiera Gedcom sontfile doncare lestherefore suivantsas :follows:

    LeThe choixchoice deto considérerconsider cesthese 7 catégoriescategories deof donnéedata commeas étantbeing desrecords enregistrementsis estarbitrary arbitraireof biencourse, sûr,but maisit c'estis lealways principethe d'unecase norme.when creating a standard.

    OnOne pourraitcould facilementeasily imaginerimagine d'autresother types d'enregistrements,of commerecords, lessuch lieuxas parplaces exemple.for Leexample. faitThe qu'unfact lieuthat nea soitplace pasis unenot entitéa àseparate partentity n'empêchedoes pasnot prevent Ancestris defrom lesmanaging gérer.them.

    Arborescence d'un enregistrement

    Chaque enregistrement se présente de manière arborescente : chaque tag peut comprendre un nombre quelconque de sous-tags.

    Des sous-tags sont des tags hiérarchiquement dépendants du tag de niveau immédiatement supérieur, et susceptibles de comprendre à leur tour un ou plusieurs sous-tags, etc.

    Chaque niveau peut ainsi se subdiviser à l'infini.

    Niveaux hiérarchiques

    Les hiérarchie sont numérotées.

    Comme chaque ligne doit rester impérativement à sa place du point de vue de la hiérarchie, chacune d'elles est affectée d'un numéro correspondant au niveau qu'elle occupe dans l'arborescence de l'enregistrement.

    C'est ainsi que la ligne du niveau principal de chaque enregistrement (c'est-à-dire le niveau zéro) porte le numéro 0 ; une ligne située au niveau immédiatement inférieur porte le numéro 1 ; une ligne située au niveau immédiatement inférieur au niveau précédent porte le numéro 2 ; et ainsi de suite.

    Identifiant et catégorie des niveaux zéros

    Le niveau zéro de chaque enregistrement (autre que les deux enregistrements extrêmes, HEAD et TRLR) est composé de deux éléments accolés :

    • Le numéro ID de l'entité encadré de deux arobases (@),
    • Le tag associé à la catégorie à laquelle appartient l'entité en question.
      • Par exemple, l'en-tête @I24@INDI signifie que l'enregistrement a pour numéro ID le I24, et qu'il appartient à la catégorie des individus (autrement dit, individu numéro I24).

    Indentation

    Pour plus de clarté, les différentes lignes d'un enregistrement peuvent être indentées (affectées d'un ou plusieurs espaces à gauche du premier caractère), de manière à repérer plus facilement la place qu'occupe chacune d'elles dans la hiérarchie.

    • Exemple non indenté :
    0 @I3@ INDI (tag principal de cet enregistrement : individu I3)
    1 NAME Jean Martin (nom de l'individu)
    1 SEX M (sexe de l'individu : masculin)
    1 BIRT (naissance de l'individu)
    2 DATE 16 avril 1951 (date : 16 avril 1951)
    1 FAMC @F5@ (famille dont descend l'individu I3 : famille F5)
    
    • Le même exemple indenté :
    0 @I3@ INDI (tag principal de cet enregistrement : individu I3)
      1 NAME Jean Martin (nom de l'individu)
      1 SEX M (sexe de l'individu : masculin)
      1 BIRT (naissance de l'individu)
        2 DATE 16 avril 1951 (date : 16 avril 1951)
      1 FAMC @F5@ (famille dont descend l'individu I3 : famille F5)
    

    L'éditeur Gedcom d'Ancestris adopte un affichage indenté, mais ne fait pas apparaître les numéros de niveau. Il ajoute en outre des poignées permettant d'afficher ou de masquer les sous-tags de telle ou telle branche.

    • Le même exemple indenté, mais sans les numéraux de niveaux :
    @I3@ INDI (tag principal de cet enregistrement : individu I3)
      NAME Jean Martin (nom de l'individu)
      SEX M (sexe de l'individu : masculin)
      BIRT (naissance de l'individu)
        DATE 16 avril 1951 (date : 16 avril 1951)
      FAMC @F5@ (famille dont descend l'individu I3 : famille F5)
    
    

    Composition d'une ligne dans un enregistrement

    Ligne standard

    Chaque ligne d'un enregistrement contient essentiellement les éléments suivants :

    • Le numéro de niveau (de 0 à n),
    • Le tag indiquant la nature des informations contenues sur la ligne,
    • Les informations associées au tag en question.

    Exemple :

    • La ligne 2 DATE 16 avril 1951 peut se lire ainsi : ligne de niveau 2, information de type DATE, et de contenu 16 avril 1951

    Référence à une autre entité

    Certaines lignes contiennent en outre une référence à une autre entité, laquelle consiste en un numéro encadré par deux arobases (@). Cette référence constitue un marqueur spécial dont le rôle est différent selon la place qu'il occupe par rapport au tag de la ligne.

    • Une référence située à gauche du tag indique le numéro de l'enregistrement courant (numéro toujours unique dans la catégorie d'entité dont il relève) : ce cas de figure ne se produit que sur la ligne de niveau 0 de l'enregistrement. Exemple :
      • 0 @I3@ INDI : ligne principale de l'entité faisant l'objet de cet enregistrement, numéro ID de cet enregistrement : I3, catégorie d'entité : individu.
    • Une référence située à droite du tag, indique le numéro d'un autre enregistrement, et renvoie à ce dernier afin de le mettre en relation avec l'enregistrement courant. Exemple :
      • 1 FAMC @F5@ : ligne de niveau 1, tag FAMC (famille dont descend l'individu courant) et référence F5 (autrement dit : l'individu courant descend de la famille F5)

    Norme Gedcom

    La norme Gedcom désigne l'ensemble des règles qui régissent ce qu'il est possible de faire et ne pas faire pour que tout le monde range les informations généalogiques d'une certaine façon. C'est donc la grammaire du langage Gedcom.

    Deux normes principales existent, 5.5 et 5.5.1, la seconde étant une légère évolution de la première. Des choses permises dans la première ne le sont plus dans la seconde, et vice-versa. Ces différences sont néanmoins limitées.

    Ancestris sait gérer les normes 5.5 et 5.5.1.

    Vous trouverez en bas de page plusieurs liens qui rassemblent l'ensemble de la documentation que l'on a trouvé sur les normes Gedcom.

    Nous vous proposons ici une traduction des points essentiels de la norme et leur utilisation dans Ancestris.

    Norme Gedcom 5.5

    Vous trouverez ici le détail de toute la norme 5.5 sous forme de liens web.

    Tables des matières

    Lettre de William S. Harten
    Tableau type des données - Page 1 - Page 2
    Introduction


    Chapter 1: Grammaire de la Représentation des données

    Chapter 2: Grammaire Liée à la Parenté (En français sur ce wiki Grammaire Gedcom.)

    Chapter 3: Utilisation des jeux de caractères dans GEDCOM

    Chapter 4: Enregistrement de la Production GEDCOM
    Appendice A : Définition du Tag Gedcom Lié à la Parenté (En français sur ce wiki : Définition des tags)
    Appendice B : Références Croisées

    Appendice C : Codes LDS Temple
    Appendice D : Jeu de Caractères ANSEL

    Appendie E : Encoder/Décoder Objets Multimedia

    Norme Gedcom 5.5.1

    Vous pouvez aussi consulter la norme Gedcom 5.5.1 ici sous forme de fichier pdf en anglais : Norme Gedcom 5.5.1. Curieusement, les deux normes ne sont pas disponible sous le même format.

    Vous trouverez dans ce même document un comparatif entre les deux normes.

    Liens utiles