Reconnaissance des formes appliquées aux caractères arabes

No Thumbnail Available
Date
2008
Journal Title
Journal ISSN
Volume Title
Publisher
Université d' Oum El Bouaghi
Abstract
La reconnaissance d'écriture arabe est spécialement celle des mots manuscrits n'a pas encore atteint la maturité nécessaire pour permettre d'établir des études comparatives et approfondies des travaux effectués dans le domaine. Ceci est dû au nombre restreint de travaux menés sur les mots arabes manuscrits comparés à ceux portant sur les caractères ou mots imprimés et au fait que la plupart des modèles proposés n'ont pas dépassé le stade de tests préliminaires à cause du manque de bases de validation communes. Il est donc nécessaire d'unifier les bases et les protocoles de validation des résultats entre les différentes équipes de recherche. Dans ce mémoire on a présenté un système de reconnaissance d'écriture arabe manuscrite hors-ligne utilisant un réseau Fuzzy ART comme classifieur. Nous avons commencé par introduire l'écriture arabe elle-même en s'attardant sur ses caractéristiques et difficultés ainsi que les approches de reconnaissance utilisées. Nous avons également présenté un historique des OCRs conçus pour l'écriture arabe. Aussi nous avons expliqué le principe des classifieurs utilisés dans les systèmes de reconnaissance de mots arabes tels que : les réseaux de neurones (PMCs et les réseaux Fuzzy ART), les SVMs, le classifieur bayésien, les HMMs et les k-ppvs. Ensuite nous avons vu en détaille les différentes composantes architecturales possibles d'un OCR, abordant principalement les phases : de prétraitement, de segmentation, d'extraction de primitives, de reconnaissance et de poste-traitement. Finalement nous avons présenté notre propre système de reconnaissance REMA qui est basé sur une approche globale ; où nous avons discuté des différentes phases de son implémentation en expliquant les outils et les algorithmes utilisés, ainsi que les tests et résultats enregistrés. Nous nous sommes principalement intéressés à la reconnaissance de l'écriture arabe manuscrite. La base IFN/ENIT a servi pour le développement et l'évaluation des travaux menés. Les résultats obtenus sont encourageants. Le taux d'erreur noté est principalement dû à la mauvaise écriture et aux problèmes de chevauchement des lettres dans les mots classés. L'étape de post-traitement n'a pas été abordée, et une possible combinaison entre deux ou plusieurs classifieurs est envisageable pour nos améliorations futures du système proposé
Description
Keywords
Intelligence artificielle : génie logiciel, Reconnaissance : écriture arabe : logiciel, Reconnaissance : caractère arabe : logiciel
Citation