Introduction à Apache Hadoop. Partie 3 : installation, supervision et performance d'un cluster multinœud avec Cloudera CDH 5

/images/hadoopjeuenfant.jpg

Le troisième article sur Apache Hadoop est enfin disponible et s’intéresse d’une part à l’installation et la configuration d’un cluster Apache Hadoop multinœud et d’autre part à l’exécution d’un job MapReduce dans ce même cluster. Afin de montrer l’avantage de l’architecture matérielle que supporte Apache Hadoop, nous avons comparé l’exécution d’un job MapReduce avec celle d’un simple programme Java en insistant sur l’évolution :

  1. du nombre de nœuds pour Apache Hadoop ;
  2. du nombre de cœurs CPU pour le programme Java.

La distribution CDH 5 fournie par la société Cloudera a été utilisée pour les expérimentations.

Le lien est le suivant : /data-nosql/installation-hadoop-cloudera-cluster.

Ce billet est open source. Vous avez noté un problème de typographie ?
Ou quelque chose d'obscur ? Améliorer ce billet à partir du dépôt GitHub.