countryDetect - Détection du pays d’une affiliation

Niveau d'utilisation :  Débutant
Niveau de validation :  Validé
Objectif

Ce web service détecte le pays d’origine d’une affiliation-adresse, qu’il soit présent ou absent dans celle-ci, quelle que soit la langue de l’adresse, à condition qu’elle soit dans un alphabet latin. Le nom du pays retourné est en anglais.

 

Méthode

A partir de l’adresse d’une affiliation, le service renvoie le nom du pays détecté, en anglais, ainsi que son code ISO sur 3 lettres.
Par exemple “France, FRA ” ou “Germany, DEU”.
Dans le cas où le programme ne parvient pas à déterminer le pays, il renvoie “Unknown, N/A”

La première étape consiste à extraire le pays s’il est présent dans l’adresse.

S’il est absent, le programme va s’appuyer sur des informations comme :

  • la rue,
  • la ville,
  • le code postal,
  • le nom de l’organisme.

Ces informations sont utilisées pour localiser l’adresse, à l’aide du service de géocodage Nominatim, et en déduire le pays.

Métriques

Le programme a été testé avec une  précision  de 97%.

Précautions :
La qualité du résultat dépend fortement des informations présentes dans l’affiliation : un nom de laboratoire seul donnera soit aucun résultat soit un résultat peu fiable.

 

Références
Exemple textuel du traitement
Le format d'entrée :

[
{
"id": 1,
"value": "université sciences et technologies bordeaux 1 institut national de physique nucléaire et de physique des particules du cnrs in2p3 UMR5797"
},
{
"id": 2,
"value": "uar76 / ups76 centre national de la recherche scientifique cnrs institut de l'information scientifique et technique inist"
},
{
"id": 3,
"value": "centre de recherches sur la géologie des matières premières minérales et énergétiques cregu université de lorraine ul umr7359 centre national de la recherche scient"
},
{

"id": 4,
"value": "auf der morgenstelle 8, 72076 tuebingen"
},
{
"id": 5,
"value": "z.i. de kermelin,16, rue ampère, 56017 Vannes"
},
{
"id": 6,
"value": "campus de santa apolónia, 5300-253 bragança"
},
{
"id": 7,
"value": "campus romanus de maron"
},
{
"id": 8,
"value": "Inist-CNRS, vandoeuvre les Nancy, France"
}
]
Le résultat :

[
{
"id": 1,
"value": ["France","FRA"]
},
{
"id": 2,
"value": ["France","FRA"]
},
{
"id": 3,
"value": ["France","FRA"]
},
{
"id": 4,
"value": ["Germany","DEU"]
},
{
"id": 5,
"value": ["France","FRA"]
},
{
"id": 6,
"value": ["Portugal","PRT"]
},
{
"id": 7,
"value": ["Unknown","N/A"]
},
{
"id": 8,
"value": ["France","FRA"]
}
]

Vos données ne précisent pas explicitement le pays de publication ? Vous souhaitez visualiser les pays avec lesquels votre organisme coopère ?

En lançant countryDetect sur vos données depuis Lodex, logiciel libre de visualisation, vous obtiendrez la liste des pays coopérants et leur code sur 3 caractères pour réaliser des représentations graphiques liées.

Graphes issus des corpus Istex :

Découvrez d’autres corpus scientifiques

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres