Clustering de données dans un contexte big data

Chaker, AmineKhantoul, Bilel2018-12-052018-12-052017http://hdl.handle.net/123456789/6888Durant ces dernières années, on assiste à une prolifération de données dans plusieurs domaines. Cela est dû à l'évolution des données à haut débit qui sont devenus un outil indispensable à la recherche en plusieurs domaines de l'informatique. Pour faire face à cette évolution de données complexes, l'informatique doit exploiter des expertises diverses de haut niveau. En effet, Le Big Data s'est imposé comme l'innovation de ce début de décennie. Au coeur de cette révolution, une architecture connue sous le nom de MapReduce qui consiste en un puissant environnement massivement parallèle a émergé. Dans ce contexte, nous proposons un système parallèle distribué pour regrouper un ensemble des points basé sur le clustering des données. Pour cela, nous allons utiliser la plateforme Hadoop qui constitue l'une des meilleures plateformes du Big Data et qui repose sur le paradigme MapReduce. Dans notre travail on s'intéresse à la proposition d'une approche pour le clustering de données massives en utilisant MapReduce, cette approche est basée sur l'algorithme k-means et l'algorithme Particule Swarm Optimisation (PSO).frBig DataClusteringClustering de données dans un contexte big dataOther