HDFSのWeb UIの項目の意味
メモ。
項目 | 意味 |
Configured Capacity | 各DataNodeのdfs.data.dirで指定したディレクトリのパーティションのサイズ(File.getTotalSpace())からdfs.datanode.du.reservedで指定したサイズ(デフォルト0)を引いたものの和。予約領域以外の全領域のサイズ。 |
DFS Used | 各DataNodeのdfs.data.dirで指定したディレクトリの使用サイズ(du -sk)の和。HDFSで使っている領域のサイズ。 |
Non DFS Used | Configured Capacity - DFS Used - DFS Remaining。HDFS以外で使っている領域のサイズ。OSとかアプリケーションとかその他。 |
DFS Remaining | Configured Capacity - DFS Usedか、各DataNodeのdfs.data.dirで指定したディレクトリのパーティションの使用可能サイズ(File.getUsableSpace)の和の、どちらか小さい方。HDFSで使用可能な領域のサイズ。 |
DFS Used% | DFS Used / Configured Capacity * 100。全体からHDFSが使っている領域の割合。 |
DFS Remaining% | DFS Remaining / Configured Capacity * 100。全体からHDFSが使用できる領域の割合。 |
hadoop dfsadmin -reportも似たような感じ。
基本的に、レプリカも含めてトータルのサイズが出ている。
hadoop fs -lsとかhadoop fs -duとかで出てくるのは、
純粋なファイルサイズ(レプリカも含めてのサイズではない)。