Reconnaissance des chiffres arabes parlés par les réseaux de neurones convolutionnels

Khelil, AssiaBerrah, SouhemeAmiar, Lotfi2022-11-142022-11-142022http://hdl.handle.net/123456789/14284Le problème de la reconnaissance automatique de la parole (RAP) est un domaine d'étude active depuis les années 50. Parmi les modèles les plus utilisés dans ce domaine, les réseaux de neurones, plus particulièrement, le perceptron multi-couches (PMC). Malgré l'efficacité des réseaux de neurones, qui s'avèrent être des outils performants de reconnaissance des formes en général et de la parole en particulier, grâce à leur capacité d'apprentissage, de généralisation et de classification, il existe encore des problèmes liés à leur style d'apprentissage. Ces limitations ont conduit à proposer d'autres techniques telle que les réseaux de neurones convolutionnels (CNN, Convolution Neural Network), afin de remédier aux inconvénients et aux limites de ce paradigme, tout en améliorant le taux de reconnaissance. Les réseaux de neurones convolutionnels sont des réseaux de neurones multicouches qui sont spécialisés dans des tâches de reconnaissance de forme. Le présent sujet consiste à proposer un modèle basé sur les réseaux de neurones convolutionnels. Un avantage majeur des réseaux convolutifs est l'utilisation d'un poids unique associé aux signaux entrant dans tous les neurones d'un même noyau de convolution. Cette méthode réduit l'empreinte mémoire, améliore les performances et permet une invariance du traitement par translation. C'est le principal avantage du CNN par rapport au PMC, qui lui considère chaque neurone indépendant et donc affecte un poids différent à chaque signal entrant. Nous proposons une application du modèle conçu à la reconnaissance des chiffres arabes parlés isolés.frC.N.N.: Convolutional Neural Networks; Réseaux de neurones à convolutionsChiffre arabeRéseau neurone convolutifSpectrogrammeReconnaissance des chiffres arabes parlés par les réseaux de neurones convolutionnelsOther