Gedcom - Records - Regels - Versies

Het woord Gedcom duidt een genealogisch gegevensuitwisselings-formaat aan.

Het werd oorspronkelijk om religieuze redenen ontwikkeld door de Mormoonse kerk, en werd later opgepikt door genealogen, om genealogische gegevens uit te wisselen tussen verschillende mensen die niet dezelfde systemen hadden.

Gedcom is dus een soort genealogische taal. Het is de meest bekende en wereldwijd gebruikte.

Het woord Gedcom, wat een acroniem is voor Genealogische datacommunicatie, wordt gespeld als een acroniem: GEDCOM. Door metonymische afleiding duidt een Gedcom ook een genealogiebestand in Gedcom-indeling aan. Het bestand waaraan u werkt binnen Ancestris is een Gedcom.

Sinds het midden van de jaren negentig, met de komst van internet en de toename van digitale uitwisselingen, is de Gedcom-specificatie geleidelijk een essentiële standaard geworden voor de meeste genealogische software en sites over de hele wereld.

Hoewel de meeste van deze programma's kunnen exporteren in Gedcom-formaat, respecteren sommigen van hen het Gedcom-formaat niet strikt en maken enkele aanpassingen door eigen structuren toe te voegen of bestaande structuren te gebruiken voor andere betekenissen. In sommige gevallen kunnen deze eigen datastructuren van dergelijke programma's, niet correct worden geconverteerd naar het Gedcom-formaat en daardoor kunnen bepaalde gegevens eenvoudigweg niet worden geëxporteerd.

Ancestris is volledig Gedcom-compatibel met Gedcom-versies 5.5 en 5.5.1. Als gebruiker kunt u veilig vertrouwen op Ancestris om uitgebreide genealogiebestanden bij te houden, zonder risico op gegevensverlies, en u kunt deze bestanden met iedereen delen of aan anderen doorgeven.

Karakteristieken van een Gedcom bestand.

Een Gedcom-bestand is een tekstbestand, d.w.z. een bestand met voor mensen leesbare tekstregels, dat kan worden geopend en bewerkt met elke tekst-editor die "platte tekst" kan uitvoeren, zoals Kladblok, Notepad++, VSCode, Kate, Kwrite, Gedit, enz. De extensienaam is altijd "*.ged" .

Als gevolg hiervan kan een dergelijk bestand *zonder verdere bewerking* worden gebruikt door elke genealogische software, geïnstalleerd onder elk besturingssysteem, zonder enige conversie.

Elke regel tekst begint met een nummer en een label. Het label wordt een "Tag" genoemd. Deze Tag bestaat uit drie of vier hoofdletters. Het definieert het type informatie dat op deze regel volgt.

Zo geeft de tag PLAC (=plaats) altijd aan dat de tekst die volgt op deze tag een plaats is (zoals geboorteplaats, plaats van overlijden, plaats van een ceremonie etc.)

Records van een Gedcom bestand

Een Gedcom-bestand bevat een set records. Een record is een groep tekstregels waarvan de eerste regel begint met een nul "0". Een record definieert iets in het bijzonder, wat afhangt van het type record.

Het eerste en het laatste record van een Gedcom-bestand zijn van een afwijkend type:

Het eerste record wordt de header (HEAD-tag) genoemd en definieert wat algemene informatie over het bestand.

Het laatste record wordt de end of file trailer marker (TRLR-tag) genoemd. Het definieert het einde van het bestand.

Tussen de twee bovengenoemde records staan de overige records, deze definiëren elk een genealogische entiteit, met voor elk zijn eigen set tags.

Een Gedcom-bestand gebruikt 7 entiteitscategorieën. De records die in een Gedcom-bestand te vinden zijn, zijn daarom als volgt:

Records die individuen definiëren: (tag INDI)
Records die families definiëren: (tag FAM)
Records die notities definiëren: (tag NOTE)
Records die bronnen definiëren: (tag SOUR)
Records die archieven (repositories) definiëren: (tag REPO)
Records die mediabestanden definiëren: (tag OBJE)
Records die personen/instanties definiëren, die informatie toevoegen aan een Gedcom of deze versturen: (tag SUBM)

De keuze om deze 7 gegevenscategorieën als records te beschouwen is natuurlijk arbitrair, maar dat is altijd het geval bij het maken van een standaard.

Men zou zich gemakkelijk andere soorten records kunnen voorstellen, zoals plaatsen bijvoorbeeld. Het feit dat een plaats geen afzonderlijke entiteit is, weerhoudt Ancestris er niet van om ze te beheren en tegelijkertijd het Gedcom-formaat te respecteren.

Boomstructuur van een Record

Elk record wordt weergegeven in een boomstructuur: elke tag kan een onbeperkt aantal subtags bevatten.

Subtags zijn hiërarchisch afhankelijk van de vorige tag van een hoger niveau en kunnen op hun beurt een of meer subtags bevatten, enz.

Hiërarchische niveaus

Hiërarchische niveaus zijn genummerd.

Aangezien elke regel verplicht op zijn plaats moet blijven vanuit het oogpunt van de hiërarchie, krijgt elk van hen een nummer toegewezen dat overeenkomt met het niveau dat wordt ingenomen in de boomstructuur van het record.

Daarom is de regel op het hoofdniveau van elk record niveau nul, genummerd 0.
Een regel op het niveau direct daaronder draagt het nummer 1.
Een regel op het niveau direct onder niveau 1 draagt het nummer 2. En zo verder.

Identificatie- en entiteitsrecords

Zoals hierboven vermeld, behalve HEAD- en TRLR-records, zijn alle andere records entiteitsrecords.

Elke entiteitsrecord begint met een regel van niveau 0, gevolgd door het volgende:

Het ID-nummer van de entiteit omgeven door twee apenstaartjes (@),
De tag die is gekoppeld aan de categorie waartoe de entiteit behoort.
De regel "0 @I0005@ INDI" is bijvoorbeeld de eerste recordregel van een INDIvidu entiteit waarvan het ID 'I0005' is.

====================================================================================

Identifier and entity records

As mentioned above, apart from HEAD and TRLR records, all the other records are entity records.

Each entity record starts with a level 0 line followed by the following:

The ID number of the entity surrounded by two at-signs (@),
The tag associated with the category to which the entity belongs.
- For example, the line "0 @I5@ INDI" is the first record line of an INDIvidual entity which ID is 'I5'.

Indentation

For greater clarity, lines of a record can be indented so as to more clearly show the relationship between the lines of the record. The information lines underneath a tag qualify the tag.

Non indented record:

0 @I5@ INDI                     => this defines indidual number 'I5'

1 NAME John Doe                 => The indivudual's name is John Doe

1 SEX M                         => This individual is a male

1 BIRT                          => What follows defines his birth event

2 DATE April 16, 1951           => John Doe was therefore born on April 16, 1951

1 FAMC @F1328@                  => Family F1328 is the record that defines John Doe's family (FAM) where he is a child (C)

Indented record:

0 @I5@ INDI                     => this defines indidual number 'I5'

    1 NAME John Doe             => The indivudual's name is John Doe

    1 SEX M                     => This individual is a male

    1 BIRT                      => What follows defines his birth event

        2 DATE April 16, 1951   => John Doe was therefore born on April 16, 1951

    1 FAMC @F1328@              => Family F1328 is the record that defines John Doe's family (FAM) where he is a child (C)

The Gedcom editor is an editor within Ancestris which shows you the exact information located in the Gedcom file and all of it. It also enhances the display of this information to make it even easier to read.

This editor uses an indented display and does not show level numbers. It also adds handles, to show or hide sub-tag levels, making it easy to expand or collapse any branch.

This is how the same individual would show in the Gedcom editor:

As you can see, the Gedcom editor enhances the display by adding icons and by fetching relevant hints.

In particular, the "@F1328@" piece of data is replaced, only in the display, not in the real Gedcom file, with the relevant information about the family. Here, we therefore immediately know that John's parents are named Martin and Kelly.

Also the name is split into its lastname and firstname parts.

Line formatting inside a record

Formatting

Each line in a record is made of 3 elements:

The level number, from 0 to n,
The tag which defines the type of genealogical information that follows,
The genealogical information.

Example: the line 2 DATE April 16, 1951 means level 2, information of type DATE which value is 16 april 1951.

In order to know what this date refers to, you would have to read the previous lines. Knowing this is a level 2 line, there must be a level 1 (the event in this case) and a level 0 (the record entity) above.

Referencing another entity

Sometimes in a line, one may need to refer to another record entity. This is done using by indicating the identification number of the entity, surrounded by two at-signs (@).

The difference between reference "@id@" defining a record and reference "@id@" pointing to a record is the following:

If the reference is in the 0-level record before the tag, right after the "0", then it is a definition of a record. Example :
- 0 @I5@ INDI : defines individual I5
If the reference is on the right hand side of the tag, it references the entity. We also say it "points" towards the entity. Example, if we have this line inside an individual record:
- 1 FAMC @F1328@ : this indicates that the family from which this person is a child (meaning of FAMC), is F1328. It also assumes that F1328 is defined somewhere else in the Gedcom file as a record which should start with 0 @F1328@ FAM.

Gedcom standard

The Gedcom standard refers to the set of rules that govern what can and cannot be done when writing a Gedcom file, so that everyone organizes genealogical information in the same, so that others can understand. It is therefore the grammar of the Gedcom language.

Two main standards exist, 5.5 and 5.5.1, the second being a slight evolution of the first one. Things permitted in the first are no longer permitted in the second, and vice versa. These differences are nevertheless limited.

Ancestris handles both 5.5 et 5.5.1. standards, and can convert your Gedcom file from one standard to the other and vice-versa.

Gedcom 5.5

This norm was released on January 2nd, 1996.

You will find details of the comprehensive Gedcom standard release 5.5 here in the form of an html site.

Gedcom 5.5.1

This norm was first released in 1999 as a draft and remained stable until November 15th, 2019 when it was made official.

You can also consult the Gedcom standard release 5.5.1 as a pdf file: Norme Gedcom 5.5.1.

These 20 years of stability makes this standard a very well documented and widely used way to exchange genealogical information.

Oddly enough, the two standards documentations are not available under the same format.

You will find in the 5.5.1 document a comparison between the two Gedcom standards.