Ambari 2.2を触ったので感想を書いておく
Ambariを使ってHadoopをインストールできるので楽。あとNameNodeとResource ManagerのHA化をAmbariからぽちぽちできるのはほんと楽です。
一方で怪しい点やこうなってほしいなという点もちらほらあったので書いておきます。
ケチつけているように見えるかもしれませんがそういうつもりは全く無いです。
Ambariは使っているのでもっとよくなってほしいと思っているだけです。
HDPのRolling Upgradeの前提条件としてNameNode, Resource Manager, HiveServer2のHAがあります。前2つはAmbariでできるから良いとしてHiveServer2のHA化はAmbariからできないので事実上Rolling Upgradeする人はほとんどいないのでは。あとHiveServer2を2つ立てるのをAmbariからできるようになってほしいし、Hiveだけバージョンアップできたら良いな。
2016/3/8追記
HiveServer2を2つ立てるのは下記のようにやればできるようです。
http://docs.hortonworks.com/HDPDocuments/Ambari-2.1.0.0/bk_Ambari_Users_Guide/content/_hive_high_availability.html
Ambari MetricsをVM環境で試したらCPU使用率が上がったので結局使うの止めた。
HBaseが怪しいんじゃ無いのかな。似たような声は他でも聞いた。
Disk使用率が50%を超えると画面で教えてくれるんだけど閾値を変えられない。あとメールでAlert通知しようとしたんだけど、動く時と動かない時があって差がわからなかった。
NameNodeのeditsの置き場所に/home以下を指定できないとかログの置き場所が変えられないとか制限があった。まあこれはそのままで良いかも。
HDP2.3.2から2.3.4にupgradeするとTez Viewが消える。
https://issues.apache.org/jira/browse/AMBARI-14389
あと、DFSZKFailoverControllerが/usr/hdp/2.3.2.0-2950で起動してたけどなんでだろ。
上記のことがあったり別の事情もあったので結局upgradeしたものは消してHDP2.3.4を新規にインストールした。
Hadoop 2.6からDataNodeを止めずにdisk交換できるようになったんだけど、New in CDH 5.4: Hot-Swapping of HDFS DataNode Drives - Cloudera Engineering Blogを見るとその手順がちょっと面倒というかこれならDataNode止めた方が早くない?って感じなので、Ambariでカジュアルにできると嬉しい。
CSS, JavaScriptが変なのかリンクがおかしくなる時がある。まあリロードすれば大丈夫だった。