diseaseTag - Extraction d’entités nommées de maladies

Niveau d'utilisation :  Débutant
Niveau de validation :  Expérimental
Objectif

Ce web service détecte des entités nommées de maladies sur des textes en anglais.

Méthode

Les entités nommées sont toutes renvoyées dans un champ “diseases”.

Le modèle utilisé par ce web service, “bio-ner”, est disponible à ce lien huggingface.
Aucun fine-tuning n’a été opéré : nous mettons simplement le modèle à disposition via un web service.

Le code git pour fine-tuner le modèle est disponible à ce lien.

Métriques

Le modèle possède une f-mesure de 0.8 ± 0.04.

Précaution : Le web service fonctionne uniquement sur du texte anglais.

Références
Exemple textuel du traitement
Le format d'entrée :
[
  {
    "id": 1,
    "value": "They have been used in the prevention and treatment of malaria and autoimmune diseases, including systemic lupus erythematosus and rheumatoid arthritis."
  },
  {
    "id": 2,
    "value": "This sentence does not contain any diseases named entities"
  }

]
Le résultat :
[
  {
    "id": 1,
    "value": {
      "diseases": [
        "malaria",
        "autoimmune diseases",
        "systemic lupus erythematosus",
        "rheumatoid arthritis"
      ]
    }
  },
  {
    "id": 2,
    "value": {
      "diseases": []
    }
  }

]
En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres