funderTag - Extraction de financeurs dans un article

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service détecte des financeurs dans un article en anglais et renvoie la liste des financeurs repérés.

Méthode

Ce web service fonctionne à partir d’un modèle de détection d’entités nommées entrainé de manière supervisée avec la bibliothèque python Flair sur un corpus annoté en interne. Les données d’entrainement et de test sont issues d’Istex. Il ne s’agit pas d’un corpus Gold.

En entrée, il prend un texte en anglais.
En sortie, il renvoie la liste des financeurs repérés ou une liste vide le cas échéant.

Métriques

Le modèle possède une f-mesure de 0.83

Précautions

  • Ce web service fonctionnant avec de l’apprentissage, il est nécessaire de l’utiliser sur des phrases pour un résultat plus fiable.
  • Comme avec tout modèle d’apprentissage, les résultats sont liés au corpus sur lequel il a appris. Le service est donc améliorable avec de nouvelles données d’entrainement.
    N’hésitez pas à nous contacter
Références

Bibliothèque python Flair : https://huggingface.co/flair

Exemple textuel du traitement
Le format d'entrée :
[
{
"id": 1,
"value": "This study was funded by the CNRS and INIST."
}
]
Le résultat :
[
{
"id": 1,
"value": "['CNRS','INIST']"
}
]

Vous souhaitez connaître les agences qui ont financé les études présentent dans votre corpus ?

En lançant funderTag sur du texte intégral, depuis Lodex, logiciel libre de visualisation, vous obtiendrez la liste de ces agences et des représentations graphiques liées. Actuellement, les noms ne sont pas homogénéisés d’où la présence d’ANR et d’Agence Nationale de la Recherche

Graphe issu d’une étude réalisée pour la Direction des Données Ouvertes de la Recherche (DDOR) (Comptes rendus annuels d’activité des chercheurs CNRS 2020-2021). Le web service a traité le texte intégral.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres