Browsing by Author "Khantoul, Bilel"
Now showing 1 - 4 of 4
Results Per Page
Sort Options
Item Analyse des sentiments avec le deep learning(Université de Larbi Ben M'hidi- Oum El Bouaghi, 2022) Saadouni, Oumaima; Mehia, Yassine Salah Eddine; Khantoul, BilelL'Analyse des sentiments également connue sous le nom d'extraction d'opinions, c'est une technique d'identification et de catégorisation des avis des clients (positifs, négatifs ou neutres).Cependant, il existe des problèmes d'analyse et d'évaluation de ces avis, l'analyse manuelle prend beaucoup de temps, donc les chercheurs ont essayé de trouver des solutions et des techniques automatiques pour faciliter cette tâche. L'apprentissage automatique et l'apprentissage en profondeur sont les techniques les plus utilisées dans le domaine de traitement du langage naturel. Ce travail présente des modèles d'algorithmes d'apprentissage automatique et d'apprentissage profond, cette dernière s'appuie sur les réseaux de neurones, les transformateurs(BERT).Les résultats obtenus sont satisfaisants. Nos modèles de classification de base ont été entrainés sur deux ensembles de données à savoir : twitter samples et IMDBItem Clustering de données dans un contexte big data(Université Oum El Bouaghi, 2017) Chaker, Amine; Khantoul, BilelDurant ces dernières années, on assiste à une prolifération de données dans plusieurs domaines. Cela est dû à l'évolution des données à haut débit qui sont devenus un outil indispensable à la recherche en plusieurs domaines de l'informatique. Pour faire face à cette évolution de données complexes, l'informatique doit exploiter des expertises diverses de haut niveau. En effet, Le Big Data s'est imposé comme l'innovation de ce début de décennie. Au coeur de cette révolution, une architecture connue sous le nom de MapReduce qui consiste en un puissant environnement massivement parallèle a émergé. Dans ce contexte, nous proposons un système parallèle distribué pour regrouper un ensemble des points basé sur le clustering des données. Pour cela, nous allons utiliser la plateforme Hadoop qui constitue l'une des meilleures plateformes du Big Data et qui repose sur le paradigme MapReduce. Dans notre travail on s'intéresse à la proposition d'une approche pour le clustering de données massives en utilisant MapReduce, cette approche est basée sur l'algorithme k-means et l'algorithme Particule Swarm Optimisation (PSO).Item Sentiment analysis with deep learning(Univérsité Oum El Bouaghi, 2020) Bouaziz, Dia Eddine; Khantoul, BilelSentiment analysis is a natural language processing task, it has been a topic of interest for the last two decades. This task has many problems, the problem of representing the data, since the data always takes the shape of raw text which the computer can't understand, and the problem of classification which could be fulfilled with many different classification techniques of machine learning and deep learning. Deep learning is one of the most recent solutions for the problem of sentiment analysis, we find a lot of contributions that have used it as a solution to this type of task and obtaibed very good results. In this thesis we will be studying deffirent data sets. We will treat them so they can be presented to our machine learning and deep learning models and finaly we will do a comparison between the deffirent results we got..Item Validation de clustering des donneés dans un contexte big data(Université Oum El Bouaghi, 2018) Medfouni, Hayet; Khantoul, BilelFor more than five (05) decades, computing has become the heart of our businesses, our hospitals, our ministries, our homes.....Etc. This strong use of computing has generated large volumes of data that are not manageable by conventional software and hardware. Take the case of human-sized companies like Google and Microsoft, these major subsidiaries that must have billions of data to keep. This perplexity in the management of these large volumes of data gave birth to Big Data. The quantities of potentially infinite data and the constraints that derive from it pose many problems of treatment. Among these constraints include the impossibility of storing all these massive data, the difficulty of partitioning them into homogeneous groups without knowing a priori the number of clusters, or the need to produce these clusters in real time. In this work, we propose a distributed parallel approach to solve the problem of scaling external clustering validation approaches to allow the use of large data setsby considering the following index: Jaccard coefficient. To do this, we will use the Hadoop platform which is one of the best Big Data platforms and relies on the MapReduce paradigm.The results obtained show the validity of the models developed on the Hadoop platform.