月別アーカイブ: 2018年3月

新しいサーバきたる

JAISTの3つあるスパコンの一つが新しくなりました。
PCClusterという,まあ,どちらかといえば,すごいというよりはつかいやすいサーバというもの。ちなみに1番すごいのが,約1年前に入れ替えられた,Crayのスパコン。これは世界ランキング300位くらいのいいもの。1万以上のCPUがあるそうで。
今回入れ替えられたのが,GPUがあるスパコン。以前はGPUノードが4つ?しかなく,いつも誰かが使っていて使えたものではなかったのですが,今回はGPUノードが追加されています。
Tesla P100が積んであるノードが8台。なので合計12台使えることになりました。ちなみに以前からあるものはK40というチップのもの。

余談ですが,アマゾンのGPUインスタンスでp2.xlargeというものがあるのですが,これがTesla K80とのこと。これで1時間$0.9なのでそこそこいい値段。こちらによれば,K80とP100は約倍くらい性能が違うとのこと。

で,早速使って見ました。Pythonはちょちょっとコピーしてインストールし,ちょっと環境変数の設定で戸惑ったのですが,なんとか完了。サンプルのMNISTを動かしたらあっという間に終了。
ただ,GPUノードのジョブは最大2日間でKILLされてしまうのであまりにも重い計算はできそうにありません。

とはいいつつ,LSTMを使った計算を昨日から流しているのですが,どうやらまだ半分程度しか終了しておらず,困ったことに。時間的な制約もあるので,計算ロジックなどどうするか考えないと。

しかし,こんないいマシンがタダで使い放題。授業料分を取り返すのはすぐかもしれません。