2. PC演習室環境と共生するPCクラスタの構成法とその評価 [セッション1: システム管理(1)]

2. PC演習室環境と共生するPCクラスタの構成法とその評価
○大柚智・桝田秀夫(京都工繊大)

・演習室の使ってないマシンを、クラスタ化してしまえ

・演習目的の利用を妨げじゃいけない
・1日に何回も切り替えが発生、切り替えが短時間で出来る手法の確立
・セキュリティやメンテナンス上の問題がないこと
・クラスタプロセスを演習利用者から隠蔽
・演習利用者のプライバシーも保護、OSのインスタンスを個別に用意

・ノードの運用形態
・既存の方式:再起動、OSの切り替えの度に再起動は時間が掛かる
・提案方法:両方のOSを平行して稼働、OSの切り替え時間が減少、平行稼働の手段は仮想計算機ソフトウェア、オーバーヘッドで処理能力が低下、しかし1日辺りの処理能力が向上する

・仮想計算機ソフトウェアの決定
・UNIX環境、リソースの利用効率、HostOSからの操作のしやすさ、
・カーネルのアプリケーション化を選択
・実験環境の都合上、UML(User Mode Linux)を選択

・クラスタノードの設計
・演習用OSの上に制御モジュール、クラスタ用OSをのっける

・クラスタミドルウェア:SCore 6.0.2
・Linux、並列プログラミング環境、チェックポイント機能、ノード故障検知機能
・制御モジュールの動作、演習用OSへのユーザログインログアウトで、クラスタOSの起動、休止を制御

・評価
・仮想化によるオーバーヘッド
・N-Queen問題の計測時間
・ノード台数1-4でN=15に置ける計算時間を測定、総当たり法
・Native(仮想化無しクラスタ)とUML(仮想化有りクラスタ)の比較
・仮想化によるオーバーヘッドは15%
・1日辺りの処理能力で比較
・既存:21時から9時までの12時間稼働
・平行稼働:上記に加えて残り時間も使用、全て仮想化で
・損益分岐点82%、円周率利用率が82%未満なら1日辺りの処理能力向上
・ノード機能停止時の計算時間
・理想の相対性能に対して、50%低い、、、
・途中でログインが発生したときに、そいつのタスクを他の一台に割り当てちゃってる、、、そりゃだめだ、残りのノードにタスクをうまく分割させないと、途中で分割するのは困難、最初からバラバラにばらしておく、ここが今後の課題
・あと、復帰ノードに対するジョブの割り付けも問題

Q.演習OSに任せちゃえば?
A.セキュリティ上の問題で、クラスタプロセスと演習OSの分離しないと
Q.それはクラスタのOSがあほなんちゃうん(笑)?

Q.クラスタユーザへのメリットは? 自分のジョブの終了時間が見えない
A.処理が短くなるメリットを最大限アピール

Q.SCore選定理由
A.将来的にはMPI環境に対応させたい、広島大学がSCoreを使っているとのことで(質問者SCore)
Q.SCore結構トラブってるんだけど、、、
A. ....
Q.OSのマイグレーション
A.現在設計中

Q.15%のオーバーヘッドって悪くない? 他との比較
A.他のものでも、10%前後(VMWare)、今回は操作のしやすさとのトレードオフ

Q.演習室の利用率82%の分岐点は実際どのくらい?
A.利用者が60%前後なので満たしている

Q.何台くらいで使うと、よさげ? もう、最近だったら買った方が安いとか
A.イメージしてるのは50-60台、演習室一室

Q.LinuxじゃなくってWindowsクライアントで動かす
A.CoLinuxを走らせるというのもアリ、性能もほぼ同じ