União de duplicados
Esta ferramenta de fusão de duplicados detecta duplicados e permite-lhe uni-los automática ou manualmente se forem verdadeiros duplicados, ou confirmá-los como não duplicados se não o forem.
Existem três formas de procurar e unir duplicados. São explicadas nesta página.
- Pesquisa global em toda a genealogia.
- Detecção automática sempre que uma entidade é modificada.
- Acção manual de união pelo utilizador sobre duas entidades seleccionadas.
- Arrastar e largar entidades de uma genealogia para outra.
A janela seguinte é utilizada em todas estas situações.
Descrição
Esta ferrmenta é composta de três elementos:
- a janela Critérios de detecção, onde pode definir alguns dos critérios que determinarão se duas entidades devem ser consideradas como duplicadas ou não;
- a janela Unir, onde verá todos os potenciais duplicados e decidirá se os deve fundir ou não;
- e a Nota especial sobre não duplicados, onde o Ancestris grava todas as suas confirmações de que duas entidades não são duplicadas.
Antes de descrever estes 3 elementos, vamos primeiro ver como o Ancestris mede a probabilidade de 2 entidades serem duplicadas ou não. O Ancestris calcula uma pontuação de semelhança.
Pontuação de semelhança
Muitas vezes é difícil afirmar com total certeza se duas entidades são duplicadas ou não. Mesmo um ser humano pode por vezes ter dificuldade em certificar que dois indivíduos ou entidades são definitivamente iguais ou definitivamente diferentes.
É claro que seria mais fácil limitar a detecção dizendo que duas pessoas com exactamente o mesmo apelido, nome próprio e data de nascimento são duplicados. Na realidade, as datas podem estar em falta ou ser aproximadas, os nomes próprios podem estar numa ordem diferente ou incompletos, etc. Nestes casos, é desejável que o Ancestris seja capaz de detectar algo.
É por esta razão que o Ancestris utiliza uma pontuação de semelhança. Quanto mais semelhantes forem determinadas informações, mais provável é que as entidades sejam duplicadas.
As pontuações calculadas podem variar de valores negativos a altos. São expressas como uma percentagem, embora a pontuação possa exceder 100%.
O Ancestris elabora então uma lista de potenciais duplicados com base nesta pontuação, com a intenção de lhe dizer: "Embora não seja certo, dadas as semelhanças nas informações entre estas duas pessoas, é possível que sejam duplicados. E este é o nível de confiança entre elas". Depois, cabe-lhe a si decidir se quer unir ou descartar a semelhança.
Isto significa que o Ancestris pode mostrar-lhe potenciais duplicados que você considera não serem duplicações e, inversamente, pode não encontrar certas duplicados que você considera serem verdadeiras duplicações.
Pedimos desculpa por o detector não ser perfeito e por favor, informe-nos se encontrar algum destes casos.
Janela de selecção de entidades
Quando é lançada uma pesquisa global de duplicados, a janela de critérios de detecção é mostrada, com uma série de critérios.
Marque as caixas das entidades para as quais pretende procurar duplicados.
Apenas as caixas para entidades presentes no ficheiro Gedcom estão activadas. No exemplo acima, não existem entidades multimédia.
Se pretender excluir da pesquisa os duplicados conhecidos, ou seja, aqueles que já confirmou não serem duplicados, marque a caixa correspondente.
Para ver a lista de pares de entidades que já confirmou não serem duplicados, clique em Mostrar lista. Verá a lista de entidades não duplicadas.
Janela de união
Para entidades comparadas como duplicados, é utilizada a seguinte janela.
Esta janela exibe uma a uma a lista total de todas as duplicatas potenciais cuja probabilidade é maior que 50%.
A lista é ordenada do par de duplicados mais provável para o par menos provável, por categoria de entidade. Para cada par de entidades semelhantes, o Ancestris dá-lhe uma percentagem de probabilidade.
As grandes genealogias podem conter vários milhares de duplicados. Esta janela apenas apresentará os primeiros 10.000 duplicados para cada tipo de entidade. Se a sua genealogia contiver mais duplicados, terá de os unir antes de poder ver os outros.
O título da janela mostra o número do par de duplicados apresentado e a pontuação de semelhança, que indica que as duas entidades neste par são de facto as mesmas e devem, portanto, ser unidas.
É mostrada uma mensagem geral, consoante a situação em que a ferramenta foi lançada: pesquisa global, detecção automática ou acção manual.
Cada par de duplicados composto por duas entidades é mostrado em duas as colunas.
No cabeçalho de cada coluna, um botão permite-lhe selecionar cada uma das entidades nos editores para obter mais detalhes.
Em cada coluna, são mostradas as propriedades de cada uma das entidades no presumível duplicado.
- Os valores que são diferentes são mostrados a vermelho.
- Os valores idênticos são apresentados a azul para a entidade à esquerda e a cinzento para a entidade à direita.
- Os valores semelhantes são apresentados a azul em ambas as colunas.
O objectivo da comparação é unir a entidade da direita com a entidade da esquerda, se se confirmar que são duplicados.
Como resultado, está disponível uma caixa de verificação para cada propriedade no lado direito para dizer ao Ancestris para manter a informação seleccionada para cada entidade depois de as unir.
Os botões permitem-lhe consultar a lista de potenciais duplicados, adiar a decisão, unir agora, ou confirmar agora que não são duplicados.
Barra de botões
Campo de procura de duplicados 
Utilize este campo para procurar um duplicado na lista. Introduza o texto e prima Enter.
Bouton aller au début 
Affiche le premier doublon de la liste dans l'ordre de l'indice de confiance, c'est-à-dire le doublon le plus probable, ou le doublon qui se trouve 100 positions avant le doublon actuel s'il y a plus de 100 doublons dans la liste.
Bouton aller au précédent 
Affiche le doublon précédent. Si un texte de recherche existe dans le champ Rechercher de doublon, il affichera le doublon précédent correspondant à ce critère de recherche.
Bouton retourner les entités 
Intervertit les entités de gauche et de droite afin de fusionner ensuite les deux entités sur celle de droite. Cette opération est utile si la plupart des informations à conserver après la fusion se trouvent sur le côté droit.
Bouton aller au suivant 
Affiche le doublon suivant. Si un texte de recherche existe dans le champ Rechercher de doublon, il affichera le doublon suivant correspondant à ce critère de recherche.
Bouton aller au dernier 
Affiche le dernier doublon de la liste dans l'indice de confiance, donc le doublon le moins probable, ou le doublon qui se trouve 50 positions après le doublon actuel s'il y a plus de 100 doublons dans la liste.
Bouton retirer ce doublon de la liste 
Supprime le doublon potentiel de la liste affichée.
Cette option est utile si vous ne savez pas encore si les deux entités sont des doublons ou non, et si vous souhaitez reporter la décision.
Si une nouvelle recherche globale de doublons est lancée, le doublon réapparaîtra.
Bouton Fusionner à la main 
En cliquant sur le bouton Fusionner, les entités seront fusionnées en utilisant les cases à cocher indiquées.
L'entité de droite est supprimée du fichier Gedcom et les informations dont la case est cochée à droite sont ajoutées à, ou bien remplacent, celles de l'entité de gauche.
Pour les informations qui ne peuvent exister qu'une seule fois, il n'est possible de conserver les informations que dans l'une des deux entités.
Dès que la fusion est effectuée, la fenêtre affiche le même doublon avec le résultat de la fusion afin que vous puissiez vérifier que tout a été conservé comme vous le souhaitiez.
Vous pouvez ensuite passer au doublon suivant.
Bouton Fusionner automatiquement 
En cliquant sur le bouton Fusionner, les entités seront fusionnées automatiquement par Ancestris sans utiliser les cases à cocher.
Ancestris déterminera quelles informations de l'entité à supprimer doivent être conservées et enrichira les informations de l'entité à conserver.
Ancestris vous permet d'effectuer cette fusion automatique pour 3 périmètres différents. Lorsque vous appuyez sur le bouton Fusion automatique, les choix suivants apparaissent.
Les choix sont les suivants
- Entités de ce doublon uniquement :
- Seul le doublon actuellement affiché sera fusionné.
- Ancestris détectera les informations à conserver sur l'entité de droite pour enrichir l'entité de gauche.
- Ensuite, le doublon sera mis à jour et n'affichera que l'entité de gauche en texte vert avec les informations résultantes.
- La fenêtre de sortie (Ctrl+T) affiche les entités fusionnées et le score. Vous pouvez analyser ce fichier et le sauvegarder comme référence.
- Seul le doublon actuellement affiché sera fusionné.
- Entités de la recherche effectuée uniquement :
- La fusion automatique décrite ci-dessus sera effectuée pour tous les doublons de la liste dont le score est supérieur à un certain seuil, que vous devrez spécifier dans le champ en dessous.
- Seuls les 10 000 premiers doublons de chaque entité seront pris en compte. Utilisez le choix décrit ci-dessous si vous souhaitez fusionner toute la généalogie, et pas seulement les 10 000 premiers doublons trouvés.
- La fenêtre de résultat comprendra tous les doublons fusionnés au-dessus du score indiqué, ainsi que tous les autres doublons non fusionnés.
- Tous les doublons comprenant des entités supprimées seront supprimés de la liste.
- La fenêtre de sortie (Ctrl+T) répertorie toutes les entités fusionnées. Vous pouvez analyser et enregistrer ce fichier de sortie comme référence.
- Toute la généalogie :
- La fusion automatique décrite ci-dessus sera effectuée pour tous les doublons de la généalogie au-delà d'un score donné, et pas seulement pour les 10 000 premiers. Vous devrez spécifier ce score dans le champ en dessous.
- La fenêtre de résultat disparaîtra car il se peut qu'elle n'ait pas inclus tous les doublons trouvés.
- La fenêtre de sortie (Ctrl+T) affichera la liste de tous les doublons trouvés.
Bouton Non doublon 
Ce bouton exclut la paire d'entités des doublons potentiels.
Il marque la paire d'entités comme n'étant pas en double et enregistre cette confirmation dans la note spéciale "non duplicates".
Bouton Fermer 
Ferme la fenêtre.
Datas idênticas
Quando é que duas datas são consideradas idênticas? Quando a sua diferença em luz do dia está próxima de ou é zero.
Se indicar 365 dias, por exemplo, ou seja 1 ano, duas datas serão consideradas iguais mais ou menos 1 ano.
Se indicar 30 dias, duas datas serão consideradas iguais mais ou menos 1 mês.
Datas não preenchidas
Se uma data for comparada a uma data desconhecida, o Ancestris consideras diferentes.
Elementos do nome
Força todos os elementos do apelido a serem idênticos. Inversamente, podem ser idênticos se só certos elementos do apelido o forem.
Primeiro nome idêntico
Força todos os elementos do nome a serem idênticos. Inversamente, podem ser idênticos se só certos elementos do nome o forem.
Exclusão de indivíduos de uma mesma família
Os indivíduos da mesma irmandade ou da mesma relação pai-filho não são comparados.
Exclusão de indivíduos sem apelido nem nome
Os indivíduos sem primeiro ou último nome não são comparados.
Os critérios para outras entidades ou são uma sub-parte destes critérios ou não são modificáveis.
Janela de união
Após o início da procura de duplicados, verá a seguinte janela:
Janela
O título da janela indica o duplicado mostrado e a confiança de que as duas entidades são de facto as mesmas, logo, a serem unidas. As duas entidades do suposto duplicado estão em duas colunas.
Há um botão que permite seleccionar cada uma das entidades nos editores.
Para cada propriedade das entidades, a janela mostra os valores da propriedade do suposto duplicado. A vermelho são mostrados os diferentes dados. A azul são mostrados os dados idênticos para a entidade da esquerda, a cinzento para a entidade da direita.
O objectivo da comparação é fundir a entidade direita na entidade esquerda. Para o efeito, as caixas de verificação permitem seleccionar a informação de cada entidade a manter no final da união.
Os botões inferiores permitem mover-se nos pares de duplicados, uni-los ou ignorá-los.
Barra de botões
Botão Ir para o primeiro duplicado
Mostra o primeiro duplicado na ordem do índice de confiança, portanto o mais seguro.
Botão Anterior
Recua para o duplicado precedente.
Botão Trocar entidades esquerda e direita
Inverte as entidades esquerda e direita a fim de unir as duas entidades à esquerda. A fazer se a maior parte da informação a manter estiver à direita.
Botão Seguinte
Avança para o duplicado seguinte
Botão Ir para o último duplicado
Mostra o último duplicado na ordem do índice de confiança, portanto o menos seguro.
Botão Retirar duplicado
Retira o duplicado da lista mostrada. Se reiniciar a procura, reaparecerá.
Botão Parar a procura e fechar a janela
Fecha a janela.
União
Ao clicar no botão Unir, a entidade esquerda é removida do ficheiro Gedcom e a informação marcada à direita é adicionada à entidade esquerda.
Para informação que só pode existir uma vez (por exemplo, nascimento), só é possível manter a informação de uma das duas entidades.
Assim que a união é feita, a janela mostra o mesmo duplicado com o resultado da união, para que possa verificar se tudo foi mantido tal como desejava. Pode então passar ao próximo duplicado.
Personalização
Os elementos de personalização são os critérios. Os critérios utilizados são armazenados para a próxima utilização.
De momento, não há outras opções de personalização.