Clustering de données dans un contexte big data

No Thumbnail Available
Date
2017
Journal Title
Journal ISSN
Volume Title
Publisher
Université Oum El Bouaghi
Abstract
Durant ces dernières années, on assiste à une prolifération de données dans plusieurs domaines. Cela est dû à l'évolution des données à haut débit qui sont devenus un outil indispensable à la recherche en plusieurs domaines de l'informatique. Pour faire face à cette évolution de données complexes, l'informatique doit exploiter des expertises diverses de haut niveau. En effet, Le Big Data s'est imposé comme l'innovation de ce début de décennie. Au coeur de cette révolution, une architecture connue sous le nom de MapReduce qui consiste en un puissant environnement massivement parallèle a émergé. Dans ce contexte, nous proposons un système parallèle distribué pour regrouper un ensemble des points basé sur le clustering des données. Pour cela, nous allons utiliser la plateforme Hadoop qui constitue l'une des meilleures plateformes du Big Data et qui repose sur le paradigme MapReduce. Dans notre travail on s'intéresse à la proposition d'une approche pour le clustering de données massives en utilisant MapReduce, cette approche est basée sur l'algorithme k-means et l'algorithme Particule Swarm Optimisation (PSO).
Description
Keywords
Big Data, Clustering
Citation