投稿日:

新しいサーバきたる

JAISTの3つあるスパコンの一つが新しくなりました。
PCClusterという,まあ,どちらかといえば,すごいというよりはつかいやすいサーバというもの。ちなみに1番すごいのが,約1年前に入れ替えられた,Crayのスパコン。これは世界ランキング300位くらいのいいもの。1万以上のCPUがあるそうで。
今回入れ替えられたのが,GPUがあるスパコン。以前はGPUノードが4つ?しかなく,いつも誰かが使っていて使えたものではなかったのですが,今回はGPUノードが追加されています。
Tesla P100が積んであるノードが8台。なので合計12台使えることになりました。ちなみに以前からあるものはK40というチップのもの。

余談ですが,アマゾンのGPUインスタンスでp2.xlargeというものがあるのですが,これがTesla K80とのこと。これで1時間$0.9なのでそこそこいい値段。こちらによれば,K80とP100は約倍くらい性能が違うとのこと。

で,早速使って見ました。Pythonはちょちょっとコピーしてインストールし,ちょっと環境変数の設定で戸惑ったのですが,なんとか完了。サンプルのMNISTを動かしたらあっという間に終了。
ただ,GPUノードのジョブは最大2日間でKILLされてしまうのであまりにも重い計算はできそうにありません。

とはいいつつ,LSTMを使った計算を昨日から流しているのですが,どうやらまだ半分程度しか終了しておらず,困ったことに。時間的な制約もあるので,計算ロジックなどどうするか考えないと。

しかし,こんないいマシンがタダで使い放題。授業料分を取り返すのはすぐかもしれません。

投稿日:

メールシステムトラブル?

JAISTの前期課程では卒業するためには卒業する1年前に研究計画書を提出する必要があります。ということで,今月末がその締め切り。
提出に当たっては指導教員と副指導教員,副テーマ指導員という3人の承認がひつようです。東京の学生は本校まで承認のサインを取りに行くことはできませんので,承認のメールによりそれが代替されます。

で,ちょうどメールで承認を得たのですが,なんと,昨日起こったメールシステムトラブル。どうやら一週間前ほどのチェックポイントまでロールバックして復旧したみたいです。
ということは,多分ハードウエアトラブル(データベース?)でしょうか?
とはいえ,それ以降の更新データが全くかけてしまった状態での復旧。そのかけてしまったデータ内に承認メールがあったのが悲惨なことに。

当然取ることはできません。復旧はいつになるかわからないとのこと。データベースのトランザクションログから順次復旧するのでしょうが,相当な量になるかと思います。

不幸中の幸いのことに,スマホでもメールをPOPで取得していたのが良かったようで,そのメールをPDFにして,救出することに成功。
なんとか今月の提出に間に合いそうです。

投稿日:

JISTAオープンフォーラム

JISTA関東支部では毎年11月ごろにオープンフォーラムと称する,セミナーを開催しています。このとりしきりをするのが関東支部のスタッフ。
スタッフは20−30人ほどいるのですが,この時は人手が足りないので一般の人からもお手伝いをしてもらっています。

最近大学が忙しくてJISTAにはあまり顔を出していなかったのですが,入学後1年ほどたちようやく,授業もひと段落。そろそろ以前のように参加しようかなと思っています。
手始めに懇親会などのお手伝いをと。

オープンフォーラムは秋葉原で開催しているのですが,この秋葉原は100名ほど入るような会場はあまりないということで結構限られてきます。
昨年はお店を借り切ったりしているのですが,今年は大きめの会場を借りることに。

結婚式の2次会などで使うようなところなので結構な設備。披露宴もいけそうです。
出し物を考えたりするのが結構大変だったりするのですが,まだ2ヶ月ほどあるのでゆっくりやっていきましょう

投稿日:

久しぶりのJISTA

先週はJISTA,JSDG合同のビアパーティでした。
毎年8月の月例会は合同ビアパーティになっていて,午後のワークショップは軽めの内容で,懇親会がビアパーティになっています。

とは言っても,午前中から夕方まで授業だったので,参加したのばビアパーティのみ。
ビアパーティとはいいつつ,中華の食べ放題飲み放題というスタイル。まあ,いつもの懇親会に毛が生えた感じでしょうか。
実は最近ほとんど月例会には参加できておらず,たまに懇親会のみに参加するだけ。。
下期は授業もだいぶ落ち着いてきたので,JISTAにも参加できる予定です。

で,先週末のビアパーティ,なかなか楽しめました。最近お会いしていない人と会ってお話しできるのは非常に楽しい!
というわけで2次会のカラオケまでフル参加して帰りました。
ちなみにカラオケは学割が効きました。

投稿日:

なんでもかんでもAI

しかし,世の中,AIと名のつく製品が増えたような気がします。
AI将棋っていうのは昔からありましたが,その頃からあまり変わっていないのに何でもかんでもAIの冠がつきます。

AIによる株式の自動運用,こんなものはAIがブームになる前からずっとあったのですが,その頃から大して物自体が変わっているわけではないのにもかかわらず,AIの冠がつきます。
しかも中身はAI?って言いたくなるような代物。

いわゆるポートフォリオ理論そのままなのですが,リスクの高い(過去の株価の動きの標準偏差)商品と,リスクの低い商品をどのように組み合わせましょうかというのを,コンピュータで計算するだけ。
しかも電卓でもできるくらいの計算なので,どこがAIじゃ!と全く突っ込みたくなります。

そもそも,株価の予想なんて絶対できないのですから,過去データから計算した結果にどこまでの信頼度があるのかといったところ。それを言いだすと金融工学を全否定になってしまいますが。。

現状でのAIは,分類機として用いられることが多いでしょう。画像認識なんかまさにそれそのもの。文書分類までほぼ同じロジックでできてしまいます。
自動運転は最近,トーンが低くなって来たのですが,これも画像認識の一種であるのでしょうが,あまりのデータ量の多さにさすがに今のハードウエアでは処理しきれないのでしょう。と勝手に思っています。

まあ何はともあれ,そろそろ何でもかんでもAIをつけるのはやめてもらいたいものです。

投稿日:

競馬の予想プログラム

最近、競馬の予想プログラムの作成を行っています。これでも一応仕事なのですが。。

データの分析を行って予想着順を出し、その結果を評価するものです。最近流行りのAIという名前をつける感じになりますが、AI自体は幅の広い観念なので、まあ、とりあえずAIとつけておけば流行りに乗ったことになります。
話はそれますが、金融周り、特に証券でのAIファンドとか自動売買とか色々有りますが、これらは特に最近に突然できたものでもなく、数十年前からあったもので、最近のビックデータ分析と重ね合わせてAIと読んでいるものがほとんどではないでしょうか?よーく見てみると、これのどこがAI?と言うようなものも結構あったりします。金融工学の領域を出ていないものばかりで、AIと呼ぶにはちょっとおそまつだったりします。

因みに競馬の予想サイトは結構多いのですが、予想プログラムの作り方とか評価などを書いているサイトはあまりありません。これは取りも直さず、人が予想しているものを出しているサイトばかりということなのでしょう。このサイトは結構理論的な解説もしているので参考になります。
特に、論文の解説あたりは非常に参考になりました。感謝。
日本では競馬関連の論文は殆どありませんが、海外だとそこそこあったりします。日本の場合には競馬は、まさしくギャンブル。これを研究するなんて何事だという風潮でもあるのでしょうか?

自分の作っているものは、全部のレースに対して予想を出すものなので、すべてを当てるというのはまず無理です。まあ回収率で期待値以上出れば良しとできるでしょう。

まだまだ時間がかかりそうです。

投稿日:

人工知能系のエキスポ

『第1回 AI・人工知能 EXPO』を6月28日(水)~30日(金)があるみたいです。
人工知能学会のMLで流れてきました。招待券もいつものリードエグジビションジャパンから送られてきていました。
無料セミナーでも参加してみるかとHPを見たのですが既に満席。。。

昨今のAIブームで参加者が増えているようです。言葉が独り歩きしている感がものすごく感じるのですが、とりあえず流行りには乗っておけということで、参加者が増えたのでしょう。

一昔前だとビックデータとか、もっと前になるとガラケーのアプリとか。その時代時代で流行りは変わるのですが、はやりが過ぎ去ったあとには全く人が来なくなる。本当にその来場していた人は、その技術に興味があってきたのかと言いたくなってしまいます。
取り合えす流行りものを見ておくという意味合いが強いのでしょう。AIに関しては幅がものすごく広く、本当にこれがAI?と言うようなものも結構混じっています(悪い意味で)

エキスポなので、協賛企業が何社も出るのでしょうが、何を売っているのかちょっと興味あるものの、まあ大したことはないだろうという予測のもととりあえずは、今回は見送りなのかもしれません

投稿日:

WWDC 2017

昨夜と言うか今朝はアップルの新製品発表会でしたね。

その中でも特に個人的に注目するのがMacBook。それ以外の製品にはあまり興味がありません。というのもMacBookProは2015年モデルを持っているし、iPadMini4も買ったばかりだし。。

軽めのノートブックは前からほしいと思っていました。MacBookProを持ち歩いてもいいのですが、流石に1.3kgあると持ち歩いているうちに結構重さに参ってしまいます。

MacBookだと0.9kg。これは軽い。正月にヨドバシの福袋でゲットしたASUSの海外モバイルノートもこれくらいの重さ。こちらの場合には筐体がプラスチックなので非常に軽いのです。また、バッテリーも意外と持つのですが、いかんせんCPUが貧弱なのとディスクが32Gしか無いのがちょっと苦しい。。。

メモをとるくらいならまだ使えるのですが、外に出て何か作業をしようとするとちょっとばかしスペック不足を感じてしまいます。

ということでMacBookがいいような気がしていましたがモデルチェンジまでちょっとまっていました。

今回のMacBookはメモリとCPUが選べることと、ローズピンクのカラーが追加されたことが非常に大きいです。ただし、USB-Cのみのインターフェースは変わっていないのが玉に瑕。でも、USB-Cのインターフェイスは悪いことばかりでもなく、モバイルバッテリーでも充電できるのは結構大きいです。

ただ、今回円安の影響で少しお値段が高めになってしまったことが気になるのと、先日自作PCを作成したので、流石に今回は見送りになりそうです。

投稿日:

人工知能という言葉が先行していないか

最近、IT系に限らず一般のニュースでもAIがどうのこうのというワードがよく流れています。
AIという言葉ですが、ものすごく広い意味で使われているので、ちゃんと定義しないと、この人の言っているAIとあの人の言っているAIは全く別物だったりします。

AIは総称で、実際のアルゴリズムは様々です。大きく分けると2つのアルゴリズムになります。
一つは分類器、この分類器、与えられたデータを2つ以上に分けるというものになります。もう一つは回帰式です。こちらは2次元平面上のy=xの線を思い浮かべればいいかと思います。x,yの2つのペアのデータから、このy=ax+bの線を作る。その際にパラメタであるa,bをデータから求めてやると回帰式になります。

人工知能といえば全てやってくれるというふうに見えると思いますが、実はこの中では色々とデータサイエンティストがモデルを試行錯誤しながら作っています。
ディープラーニングというものがワードとしてよく聞こえてきますが、このディープラーニングも分類機の一つですね。

ディープラーニングに関してはGoogleのTensorflowなどのライブラリが出ていますが、こちらも実は簡単に使えるように思えて、実際にはちゃんとディープラーニングとは何かと言うコト自体がわかっていないと、全く使えこなせません。世の中にはサンプルプログラムを動かして、さもディープラーニングしてみたぜ!みたいな記述を多く見かけますが、それらは全く参考にならない記事だったりします。
そういう記事に惑わされずに、基本からきちっと勉強して、その上でツールなりを使っていかないと行けません。

兎にも角にも流行りに騙されず、ちゃんと本質を見極める目を持たないといけませんね

投稿日:

deepanalytics

たまたまなんですが、ディープラーニングのコンテストサイトを見つけました。

https://deepanalytics.jp

世界的にはkaggleというサイトが有名ですが、日本でもこういうサイトがあるみたいです。
このサイトは企業が機械学習で問題を解くというそのネタを提供し、参加者が精度のいいモデルを競うというサイト。結構有名企業もコンテストを開催しています。

しかも、賞金付き。数十万からという太っ腹ぶり。すごいですね。

大学生とかなら時間もあるでしょうから、腕に自身があろうとなかろうと一度は挑戦してみるのもいいかもしれません。

ここにある練習問題ですが、特に期限もなく投稿できますが、投稿した結果をすぐさま判定し、ランキングしてくれるというなかなかの面白さ。
他の人のモデルはもちろん見ることができませんのでどのようにやるのか全て自分でモデルを決めてやるということになります。

ランキングにはスコアが出ているのですが、全く同じ結果になったりすることもなかなかないみたいなので、みんな違うモデルを使っているのでしょう。

また、答えは開示されていないので投稿してみるまで精度がわからないということからちょっとドキドキ感が有ります。
ただ、1日3回までしか投稿できないので慎重に投稿して見る必要があるのがちょっと面倒。

このようにコンテストがてらモデルの練習をするのは非常にいいかもしれません。