Hadoop:CLI MiniCluster。

目的

使用 CLI MiniCluster,使用者可以輕鬆地使用單一命令啟動和停止單一節點 Hadoop 叢集,而且無需設定任何環境變數或管理設定檔。CLI MiniCluster 會同時啟動YARN/MapReduceHDFS 叢集。

這對使用者想要快速使用實際 Hadoop 叢集或測試仰賴大量 Hadoop 功能的非 Java 程式時很有用。

Hadoop 壓縮檔

您應該可以從發行版取得 Hadoop 壓縮檔。您也可以直接從原始碼建立壓縮檔

$ mvn clean install -DskipTests
$ mvn package -Pdist -Dtar -DskipTests -Dmaven.javadoc.skip

注意:您需要安裝 protoc 2.5.0

壓縮檔應該會在 hadoop-dist/target/ 目錄中。

執行 MiniCluster

您可以在解壓縮的 tarball 的根目錄內,使用以下指令啟動 CLI MiniCluster

$ bin/mapred minicluster -rmport RM_PORT -jhsport JHS_PORT

在上述範例指令中,RM_PORTJHS_PORT 應替換為使用者選擇的這些埠號。如果未指定,將會使用隨機的可用埠。

使用者可以使用多個命令列參數來控制要啟動哪些服務,以及傳遞其他組態屬性。可用的命令列參數

$ -D <property=value>    Options to pass into configuration object
$ -datanodes <arg>       How many datanodes to start (default 1)
$ -format                Format the DFS (default false)
$ -help                  Prints option help.
$ -jhsport <arg>         JobHistoryServer port (default 0--we choose)
$ -namenode <arg>        URL of the namenode (default is either the DFS
$                        cluster or a temporary dir)
$ -nnport <arg>          NameNode port (default 0--we choose)
$ -nnhttpport <arg>      NameNode HTTP port (default 0--we choose)
$ -nodemanagers <arg>    How many nodemanagers to start (default 1)
$ -nodfs                 Don't start a mini DFS cluster
$ -nomr                  Don't start a mini MR cluster
$ -rmport <arg>          ResourceManager port (default 0--we choose)
$ -writeConfig <path>    Save configuration to this XML file.
$ -writeDetails <path>   Write basic information to this JSON file.

若要顯示可用參數的完整清單,使用者可以將 -help 參數傳遞給上述指令。