Clustering de données dans un contexte big data

Chaker, Amine; Khantoul, Bilel

Clustering de données dans un contexte big data

Files

Mémoire finale clustering de données dans un contexte Big Data -Chaker amine- .pdf (4.63 MB)

Date

2017

Authors

Chaker, Amine

Khantoul, Bilel

Publisher

Université Oum El Bouaghi

Abstract

Durant ces dernières années, on assiste à une prolifération de données dans plusieurs domaines. Cela est dû à l'évolution des données à haut débit qui sont devenus un outil indispensable à la recherche en plusieurs domaines de l'informatique. Pour faire face à cette évolution de données complexes, l'informatique doit exploiter des expertises diverses de haut niveau. En effet, Le Big Data s'est imposé comme l'innovation de ce début de décennie. Au coeur de cette révolution, une architecture connue sous le nom de MapReduce qui consiste en un puissant environnement massivement parallèle a émergé. Dans ce contexte, nous proposons un système parallèle distribué pour regrouper un ensemble des points basé sur le clustering des données. Pour cela, nous allons utiliser la plateforme Hadoop qui constitue l'une des meilleures plateformes du Big Data et qui repose sur le paradigme MapReduce. Dans notre travail on s'intéresse à la proposition d'une approche pour le clustering de données massives en utilisant MapReduce, cette approche est basée sur l'algorithme k-means et l'algorithme Particule Swarm Optimisation (PSO).

Keywords

Big Data, Clustering

URI

http://hdl.handle.net/123456789/6888

Collections

قسم الإعلام الالي

Full item page