Introduction à Apache Hadoop. Partie 3 : installation, supervision et performance d'un cluster multinœud avec Cloudera CDH 5
Le troisième article sur Apache Hadoop est enfin disponible et s’intéresse d’une part à l’installation et la configuration d’un cluster Apache Hadoop multinœud et d’autre part à l’exécution d’un job MapReduce dans ce même cluster. Afin de montrer l’avantage de l’architecture matérielle que supporte Apache Hadoop, nous avons comparé l’exécution d’un job MapReduce avec celle d’un simple programme Java en insistant sur l’évolution :
- du nombre de nœuds pour Apache Hadoop ;
- du nombre de cœurs CPU pour le programme Java.
La distribution CDH 5 fournie par la société Cloudera a été utilisée pour les expérimentations.
Le lien est le suivant : /data-nosql/installation-hadoop-cloudera-cluster.
Je suis Mickaël BARON Ingénieur de Recherche en Informatique à l'ISAE-ENSMA et membre du laboratoire LIAS le jour
Veilleur Technologique la nuit
#Java #Container #VueJS #Services #WebSemantic
Derniers articles et billets