Hvordan installere og konfigurere Cloudera Manager på CentOS/RHEL 7 - Del 3


I denne artikkelen beskrev vi den trinnvise prosessen for å installere Cloudera Manager i henhold til industriell praksis. I del 2 har vi allerede gått gjennom Cloudera-forutsetningene, sørg for at alle serverne er perfekt forberedt.

Krav

  • Beste praksis for distribusjon av Hadoop Server på CentOS/RHEL 7 – Del 1
  • Sette opp Hadoop-forutsetninger og sikkerhetsherding – del 2

Her skal vi ha 5 node cluster hvor 2 master og 3 arbeidere. Jeg har brukt 5 AWS EC2-forekomster for å demonstrere installasjonsprosedyren. Jeg har navngitt de 5 serverne som nedenfor.

master1.linux-console.net
master2.linux-console.net
worker1.linux-console.net
worker2.linux-console.net
worker3.linux-console.net

Cloudera Manager er et administrasjons- og overvåkingsverktøy for hele CDH. Vi admin kaller det vanligvis et administrasjonsverktøy for Cloudera Hadoop. Vi kan distribuere, overvåke, kontrollere og gjøre konfigurasjonsendringer ved å bruke dette verktøyet. Dette er svært viktig for å administrere hele klyngen.

Nedenfor er de viktige bruksområdene for Cloudera Manager.

  • Distribuer og konfigurer Hadoop-klynger på en automatisert måte.
  • Overvåk klyngens helse
  • Konfigurer varsler
  • Feilsøking
  • Rapportering
  • Lage rapport om klyngebruk
  • Konfigurere ressurser dynamisk

Trinn 1: Installere Apache Web Server på CentOS

Vi kommer til å bruke master1 som en webserver for Cloudera repositories. Cloudera Manager er også WebUI, så vi må ha Apache installert. Følg trinnene nedenfor for å installere apache-webserveren.

yum -y install httpd

Når httpd er installert, start den og aktiver den slik at den startes ved oppstart.

systemctl start httpd
systemctl enable httpd

Etter å ha startet httpd, kontroller statusen.

systemctl status httpd

Etter å ha startet httpd, åpne en nettleser i ditt lokale system og lim inn IP-adressen til master1 i søkefeltet, du bør få opp denne testsiden for å sikre at httpd kjører bra.

Trinn 2: Konfigurer lokal DNS for å løse IP og vertsnavn

Vi må ha en DNS-server eller konfigurere /etc/hosts for å løse IP og vertsnavn. Her konfigurerer vi /etc/hosts, men i sanntid vil en dedikert DNS-server være der for produksjonsmiljøet.

Følg trinnene nedenfor for å opprette en oppføring for alle serverne dine i /etc/hosts.

vi /etc/hosts

Dette bør konfigureres på alle serverne.

13.235.27.144   master1.linux-console.net     master1
13.235.135.170  master2.linux-console.net     master2
15.206.167.94   worker1.linux-console.net     worker1
13.232.173.158  worker2.linux-console.net     worker2
65.0.182.222    worker3.linux-console.net     worker3

Trinn 3: Konfigurer SSH passordløs pålogging

Cloudera Manager blir installert på master1 i denne demonstrasjonen. Vi må konfigurere passordfri ssh fra master1 til alle andre noder. Fordi Cloudera Manager vil bruke ssh for å kommunisere alle andre noder for å installere pakker.

Følg trinnene nedenfor for å konfigurere passordfri ssh fra master1 til alle gjenværende servere. Vi kommer til å ha en bruker «tecmint» for å fortsette videre.

Opprett en bruker «tecmint» alle 4 serverne ved å bruke useradd-kommandoen som vist.

useradd -m tecmint

For å gi root-privilegiet til brukeren «tecmint», legg til linjen nedenfor i filen /etc/sudoers. Du kan legge til denne linjen under root som gi i skjermbildet.

tecmint   ALL=(ALL)    ALL

Bytt til bruker «tecmint» og opprett ssh-nøkkel i master1 ved å bruke kommandoen nedenfor.

sudo su tecmint
ssh-keygen

Kopier nå den opprettede nøkkelen til alle 4 serverne ved å bruke ssh-copy-id-kommandoen som vist.

ssh-copy-id -i ~/.ssh/id_rsa.pub [email 
ssh-copy-id -i ~/.ssh/id_rsa.pub [email 
ssh-copy-id -i ~/.ssh/id_rsa.pub [email  
ssh-copy-id -i ~/.ssh/id_rsa.pub [email 

Nå skal du kunne ssh fra master1 til å forbli alle servere uten passord som vist.

ssh master2
ssh worker1
ssh worker2
ssh worker3

Trinn 4: Installere og konfigurere Cloudera Manager

Vi kan bruke leverandør (Cloudera) repository for å installere alle pakkene ved å bruke pakkeadministrasjonsverktøyene i RHEL/CentOS. I sanntid er å lage vårt eget depot den beste praksisen fordi vi kanskje ikke har internettilgang på produksjonsserverne.

Her skal vi installere Cloudera Manager 6.3.1-utgivelsen. Siden vi skal bruke master1 som repo-server, laster vi ned pakkene i den nedenfor nevnte banen.

Opprett katalogene nedenfor på master1-serveren.

sudo mkdir -p /var/www/html/cloudera-repos/cm6

Vi kan bruke wget-verktøyet til å laste ned pakker over http. Så installer wget ved å bruke kommandoen nedenfor.

sudo yum -y install wget

Deretter laster du ned Cloudera Manager tar-filen ved å bruke følgende wget-kommando.

wget https://archive.cloudera.com/cm6/6.3.1/repo-as-tarball/cm6.3.1-redhat7.tar.gz

Pakk ut tar-filen til /var/www/html/cloudera-repos/cm6, allerede har vi laget master1 som webserver ved å installere http og vi har testet på nettleseren.

sudo tar xvfz cm6.3.1-redhat7.tar.gz -C /var/www/html/cloudera-repos/cm6 --strip-components=1

Kontroller nå at alle Cloudera rpm-filene er der i katalogen /var/www/html/cloudera-repos/cm6/RPMS/x86_64.

cd /var/www/html/cloudera-repos/cm6
ll

Opprett /etc/yum.repos.d/clooudera-manager.repo-filer på alle servere i klyngevertene med følgende innhold, her er master1 (65.0.101.148) webserveren.

[cloudera-repo]
name=cloudera-manager
baseurl=http:///cloudera-repos/cm6/
enabled=1
gpgcheck=0

Nå depotet er lagt til, kjør kommandoen nedenfor for å se de aktiverte depotene.

yum repolist

Kjør kommandoen nedenfor for å se alle tilgjengelige Cloudera-relaterte pakker i depotet.

yum list available | grep cloudera*

Installer cloudera-manager-server, cloudera-manager-agent, cloudera-manager-daemons cloudera-manager-server-db-2.

sudo yum install cloudera-manager-daemons cloudera-manager-agent cloudera-manager-server cloudera-manager-server-db-2

Kjør kommandoen nedenfor for å se alle de installerte Cloudera-pakkene.

yum list installed | grep cloudera*

Kjør kommandoen nedenfor for å starte clooudera-scm-server-db som er en underliggende database for å lagre Cloudera Manager og andre tjenesters metadata.

Som standard kommer Cloudera med postgre-sql som er innebygd i Cloudera Manager. Vi installerer den innebygde, i en ekstern sanntidsdatabase som kan brukes. Det kan være Oracle, MySQL, eller PostgreSQL.

sudo systemctl start cloudera-scm-server-db

Kjør kommandoen nedenfor for å sjekke statusen til databasen.

sudo systemctl status cloudera-scm-server-db

Konfigurer db.properties for Cloudera Manager-serveren.

vi /etc/cloudera-scm-server/db.properties

Konfigurer verdien nedenfor er EMBEDDED for å få Cloudera Manager til å bruke Embedded Database.

com.cloudera.cmf.db.setupType=EMBEDDED

Kjør kommandoen nedenfor for å starte Cloudera Manager-serveren.

sudo systemctl start cloudera-scm-server

Kjør kommandoen nedenfor for å sjekke statusen til Cloudera Manager-serveren.

sudo systemctl status cloudera-scm-server

Kjør kommandoen nedenfor for å starte og sjekke statusen til Cloudera Manager-agenten.

sudo systemctl start cloudera-scm-agent
sudo systemctl status cloudera-scm-agent

Når Cloudera Manager Server har startet opp og kjører bra, kan du se WebUI (påloggingssiden) i nettleseren ved å bruke IP-adressen og portnummeret 7180 som er portnummeret til Cloudera Manager.

https://65.0.101.148:7180

Sammendrag

I denne artikkelen har vi sett trinnvis prosess for å installere Cloudera ManagerCentOS 7. Vi vil se CDH og andre tjenesteinstallasjoner i neste artikkel.