Hadoop 檔案系統 API 定義

這是 Hadoop 檔案系統 API 的規格,它將檔案系統的內容建模為一組路徑,這些路徑可以是目錄、符號連結或檔案。

令人驚訝的是,這個領域幾乎沒有先例。有許多 Unix 檔案系統的規格將其視為 inode 樹,但沒有任何公開的規格定義「Unix 檔案系統作為資料儲存存取的概念模型」的概念。

本規格嘗試這樣做;定義 Hadoop 檔案系統模型和 API,以便多個檔案系統可以實作 API,並向應用程式呈現其資料的一致模型。它不會嘗試正式指定檔案系統的任何並發行為,除了記錄 HDFS 表現出的行為,因為 Hadoop 應用程式通常會預期這些行為。

  1. 簡介
  2. 符號
  3. 模型
  4. FileSystem 類別
  5. OutputStream、Syncable 和 StreamCapabilities
  6. Abortable
  7. FSDataInputStream 類別
  8. PathCapabilities 介面
  9. FSDataOutputStreamBuilder 類別
  10. 使用檔案系統規格進行測試
  11. 擴充規格及其測試
  12. 使用多個部分上傳檔案
  13. IOStatistics
  14. openFile()
  15. 安全模式
  16. 可復原租約