Un outil d'extraction automatique de concepts à partir de donnée textuelles
No Thumbnail Available
Date
2018
Journal Title
Journal ISSN
Volume Title
Publisher
Université Oum El Bouaghi
Abstract
L'enrichissement automatique ou semi-automatique d'ontologies à partir de textes est généralement basé sur le texte proprement dit, et le domaine lié au contenu du texte. Mais le passage, du texte à une ontologie sémantiquement plus riche, nécessite de franchir plusieurs étapes. Dans une première étape. Nous avons appliqué des techniques d'analyse de textes (TALN) afin de simplifier le texte brut en un ensemble de phrase simples, chacune est représentée sous forme de triplet de termes SVO (Sujet, Verbe, Objet) supposés porteurs de l'information des phrases dont ils sont extraits.
Dans une seconde étape, les phrases simples de type SVO générées sont placées comme concepts/relations dans les bons endroits de l'ontologie, une tâche qui n'est pas du tout facile, car on doit prendre en considération les liens sémantiques entre les concepts et les relations tels que l'hyperonymie et l'hyponymie. Pour ce faire, L'ontologie Word Net est utilisée.
La troisième et la dernière étape consiste à vérifier la consistance de l'ontologie enrichie. Le domaine de l'ontologie est la " Phytothérapie ". Cette ontologie aide l'utilisateur final à la reconnaissance des plantes médicinales ; facilite l'interrogation, la recherche des remèdes naturels aux différentes maladies ;…
Description
Keywords
L' ontologie