使用 CLI MiniCluster,使用者可以輕鬆地使用單一命令啟動和停止單一節點 Hadoop 叢集,而且無需設定任何環境變數或管理設定檔。CLI MiniCluster 會同時啟動YARN
/MapReduce
和 HDFS
叢集。
這對使用者想要快速使用實際 Hadoop 叢集或測試仰賴大量 Hadoop 功能的非 Java 程式時很有用。
您應該可以從發行版取得 Hadoop 壓縮檔。您也可以直接從原始碼建立壓縮檔
$ mvn clean install -DskipTests $ mvn package -Pdist -Dtar -DskipTests -Dmaven.javadoc.skip
注意:您需要安裝 protoc 2.5.0。
壓縮檔應該會在 hadoop-dist/target/
目錄中。
您可以在解壓縮的 tarball 的根目錄內,使用以下指令啟動 CLI MiniCluster
$ bin/mapred minicluster -rmport RM_PORT -jhsport JHS_PORT
在上述範例指令中,RM_PORT
和 JHS_PORT
應替換為使用者選擇的這些埠號。如果未指定,將會使用隨機的可用埠。
使用者可以使用多個命令列參數來控制要啟動哪些服務,以及傳遞其他組態屬性。可用的命令列參數
$ -D <property=value> Options to pass into configuration object $ -datanodes <arg> How many datanodes to start (default 1) $ -format Format the DFS (default false) $ -help Prints option help. $ -jhsport <arg> JobHistoryServer port (default 0--we choose) $ -namenode <arg> URL of the namenode (default is either the DFS $ cluster or a temporary dir) $ -nnport <arg> NameNode port (default 0--we choose) $ -nnhttpport <arg> NameNode HTTP port (default 0--we choose) $ -nodemanagers <arg> How many nodemanagers to start (default 1) $ -nodfs Don't start a mini DFS cluster $ -nomr Don't start a mini MR cluster $ -rmport <arg> ResourceManager port (default 0--we choose) $ -writeConfig <path> Save configuration to this XML file. $ -writeDetails <path> Write basic information to this JSON file.
若要顯示可用參數的完整清單,使用者可以將 -help
參數傳遞給上述指令。