Il est souvent utiles de dénombrer le nombre de lignes ou colonnes… avec certains critères, à commencer par non vide ou ≠0.
La formule pour compter le nombre de lignes (num_entree des résultats du C14)
=LIGNES(A2:A55001)
puis compter les cellule vide sur la colonne des datations C14 :
=NB.VIDE(E2:E55001)
et toujours dans cette colonne, les cellules à 0 :
=NB.SI(E2:E55001;"=0")
La formule finale fait la somme du résultat de la première formule moins la somme des 2 autres, ce que donne en une seule formule :
=LIGNES(E2:E55001)-NB.VIDE(E2:E55001)-NB.SI(E2:E55001;"=0")
… donne 42'371 datations C14 au 11/9/2024 !
En SQL, on a la fonction `DISTINCT` qui permet de ne récupérer que les valeurs uniques/distinctes d'un attribut, quand il peut être répété… ce qui est le cas typique de vieilles données !
Pour la migration des pays présents dans Banadora, j'ai donc l'équivalent de fichier DBF sous forme d'un tableur avec les pays où on retrouve par exemple pour la France : FRANCE… mais aussi F, FRA, FRAN CE, pour les EMIRAT ARABES UNIS, on a aussi EMIARATS ARABES UNIS, EMIRATS, EMIRATS ARABES UNIS.
Je souhaite définir un dictionnaire de correspondance à partir des valeurs uniques qu'il faut donc extraire de la colonne où est défini le pays.
1)
Et on doit obtenir notre liste de valeurs uniques/distinctes !