ontoportal-lirmm / ncbo_annotator

To automatically process a piece of data text to annotate it with relevant ontology concepts and return the annotations.

Home Page:http://bioportal.bioontology.org/annotator

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Expansion sémantique avec les mappings multilingues

jonquet opened this issue · comments

Cela consiste a utiliser les mappings "interportal", voir:
http://www.lirmm.fr/~jonquet/publications/documents/Article_WIMS2016_Reconciliation_Annane.pdf
et
https://github.com/agroportal/documentation/wiki/Mappings

Pour faire l'expansion d'annotations directes avec l'Annotator.
L'idée est donc que l'on puisse annoter du texte en francais avec des ontologies dans le NCBO BioPortal:

  1. soit les traductions des ontologies du SIFR BioPortal (1er niveau d'expansion)
  2. soit des ontologies alignées aux ontologies qui sont la traduction

Le cas 1 ne devrait pas être trop difficile car cela consiste juste a s'assurer que les mappings interportal sont utilisés lors de l'expansion sémantique avec des mappings (&expand_mappings=true) et a run time faire une jointure avec le NCBO BioPortal pour obtenir les informations (JSON) sur le concept mappé.

Le case 2 est un peu plus difficile, car cela consiste a faire 2 expansions consécutives. Celle du cas 1, puis pour chaque URI (concept) mappé dans le NCBO BioPortal, il faut récuperer tous ces mappings dans le NCBO BioPortal et générer alors de nouvelles annotations avec les nouvelles URI obtenues.

Pour obtenir les mappings pour une URI donné, il faut alors utilise le web service
http://data.bioontology.org/documentation#Mapping

Par exemple:

Le texte "mélanome" est donné a l'Annotator avec comme ontologies cibles SIFR:
&ontologies=MSHFRE,MDRFRE

http://services.bioportal.lirmm.fr/annotator?text=mélanome&ontologies=MDRFRE,MSHFRE&longest_only=false&exclude_numbers=false&whole_word_only=true&exclude_synonyms=false&expand_mappings=true

Il s'agit de rajouter un parametre (puis une UI):
&ncbo_ontologies=NCIT,DOID
alors, les annotations obtenues dans MSHFRE et MDRFRE e.g.,
http://purl.lirmm.fr/ontology/MSHFRE/D008545
serait expansé avec les interportal mappings vers
http://purl.bioontology.org/ontology/MESH/D008545
qui serait expansé avec les mappings vers par exemple
http://purl.obolibrary.org/obo/DOID_1909

Pour optimiser, il s'agira de ne traiter que les mappings dans les NCBO ontologies cibles... (e.g. le terme melanoma das mesh a 57 mappings!)

Pour obtenir les mappings de http://purl.bioontology.org/ontology/MESH/D008545 il faut appeller:
http://data.bioontology.org/ontologies/MESH/classes/http%3A%2F%2Fpurl.bioontology.org%2Fontology%2FMESH%2FD008545/mappings