ギリア株式会社様は、「ヒトとAIの共生環境の実現」を目指して、株式会社UEI・株式会社ソニーコンピュータサイエンス研究所・WiL,LLC の三社により2017 年6 月に設立されたAIスタートアップです。今回は民間企業におけるABCI利用のファーストユーザであり、また、自身もプログラマーの一人である清水社長にABCIの魅力をお聞きしました。
ギリア 株式会社
代表取締役社長 清水 亮 様
― ギリアさんはAIを専門としている企業ですが、常にAIの仕事をしていても、自社の計算機とABCIの両方を使うのですか?
清水 亮(以下、清水):
AIをやろうと思ったら、自社で計算機を購入するか、ABCIみたいなものを使うかの2つしか選択肢はありません。そうなると、ABCIのようなものを使った方が明らかに経済効率は良いです。購入してしまうと億単位の出費があるわりには、稼働率はあまり高くなく、お金を生んでいない場合もあります。
当社の場合、クライアント企業が非常にバラエティに富んでいます。研究者の場合は深層学習のアルゴリズムを極めていくのもいいんですが、実用上はそうではありません。全く同じアルゴリズムで、初期値を変えて計算をまずやってみて、「一番良いのはどれだ?」とやる方法が、一番効率が良いわけです。個々の学習は短いと1時間、長くても10時間ぐらいで終わってしまいます。
そのため、たかだか半日のために億単位のコンピューターを購入することを考えると、ABCIはものすごくリーズナブルです。もちろん社内にも計算機はあります。トライアンドエラーのような場合には1ノードから10ノードぐらいで足りるので、ABCIより社内の計算機の方が向いています。この方針で行けそうだと思ったら、ABCIを100ノード使って一気に学習をさせるといった使い方がすごくいいんです。
― 100ノードでも、ABCIにとっては大きなリソースではないので、いつでも使えますね。
清水:
トライアンドエラーをクラウドでやると、ストレージにデータを置いておくだけでも費用が発生しますが、ABCIは基本料金で置けるストレージのサイズも一定量与えられるため、何テラものデータを置かなければコストを抑えることができます。
実際の業務に使うデータはそれほど大きくはありません。画像でも解像度が256×256ぐらいで充分です。高解像度の画像を見せて「これは虎です」と識別させても、どうせこのあたりが虎だとしかわからないんです。256×256と言えば初代プレイステーションの解像度と同じですから、人にとっても充分なくらいです。
― AI開発そのものをビジネスにしているから、コスト感覚はシビアになりますね。
清水:
商用クラウドはとても高いですし、安い商用クラウドを使うと、計算の途中でも容赦なくネットワークが切断されます。プログラムの途中経過をセーブするようにプログラムを組んでおかないと、完全にデータがなくなってしまうんです。
また、使いすぎの問題もあります。社員に自由に利用を許可していると歯止めが利かなくなることがあったり、「止め忘れ」が発生したりすることがあります。計算のジョブが動いていなくても、ソフトウェアが稼働していれば課金されていくので、止め忘れで100万円請求されることもあります。それは遠慮したいですよね。
ABCIは、プリペイド式のためポイント購入分の範囲内で利用でき、ジョブが動いている時間が正確に管理されるため、誰がどれだけ使用したのかがわかり、ジョブが終わると保有しているポイントの消費も終了するため止め忘れがありません。非常に管理しやすいですよ。
― リソースも充分ですか?
清水:
NeurIPS1という学会がこの業界の最高峰ですが、そういった学会の直前になると全世界の研究者が一気に使うので、商用クラウドのインスタンスが枯渇するという問題が起きます。しかし日本の企業はABCIが使えます。そういう意味でもABCIの存在意義は結構大きいと思いますね。導入当初は少々、ABCIの安定稼働に問題がありましたが、安定してからは柔軟であるし、好きなツールが入れられるため良いと思います。
― 商用クラウドとの使い勝手の違いはどんなところでしょうか?
清水:
極論すると、普通のクラウドではできないことの方が多いですよ。できるかもしれないですが、非常に面倒くさいんです(笑)。
商用クラウドはあくまでもクラウドですから、100台を繋ごうとすれば繋げます。ただ、100台自分で管理するんだぞ、というのがクラウドです。100台のマシンのグローバルIPアドレスのリストがあって、お互いのマシンに相互ログインできる設定をして、それらに分散処理するとか、共有ディスクを設定するとかの対応が必要になってきます。分散学習させるための環境を組む方が絶望的に大変で、私も何回か体験したことがありますが二度とやりたくないと思います。社内で専門の部隊を作りメンテナンスをすればいいですが、技術者を1人雇うとその分コストが加算されます。そのあたりのメンテナンスを全部行ってくれるのがABCIです。
― 一般的なクラウドサービスはバラバラのノードを自分でつないで使うけれど、ABCIは繋がっているノードの一部を使うわけですね。
清水:
ABCIはクラウド基盤という名前ですが、スパコンの感覚で使うことができます。スパコンの味噌は、ノード間のインターコネクトです。CPUやGPUの速度よりバスの通信速度の方がはるかに重要になるので、クラウドを使って疑似スパコンを作ろうとしても、インターコネクトが遅すぎて全く役に立たないことがよくあります。サーバーが別の地域に分散していたら全然だめですし、同じ地域でも別の建物だと遅いです。ABCIは、柏の葉にある1つの建物に全部入っているのでそれは強みですよね。インターコネクトもちゃんと作ってある点もそうです。
商用クラウドを使い慣れていてスパコンを普段使っていない人からすると、スパコンの使い方は独特に見えるでしょう。でも一度スパコンに慣れてしまうと、もう商用クラウドは使いたくないと思えるくらいですね。
― 理化学研究所のスーパーコンピューター「京」の後継機、「富岳」の計画が発表されました。「京」や「富岳」はCPU中心のスパコンですが、ABCIはGPUが充実しています。ディープラーニングにはGPUの方が向いているのでしょうか?
清水:
これはなかなか難しい話で、「今はそう言われています」が正しいです。2018年末ぐらいまではGPUの発展と低価格化がものすごい速さで進んでいき、利用者はそれについていこうとする段階でした。それがようやく踊り場にきて、ゆるやかな坂に差し掛かっています。GPUに最適化するのが良いのか、それ以外の方法がいいのか、というのが今また争点になっているんですね。
― 今までの進歩が速すぎた。
清水:
なんでディープラーニングがこんなに急に進歩したかというと、一番の要因は貯金があったからなんです。ニューラルネットワークという考えは70年くらい前からあって、当時の計算機では実現できなかったのが、だんだん性能が上がって90年代にものすごくたくさん研究されました。
― AIという言葉が一度、流行りましたね。
清水:
正しくは3回流行っていますね。1回目は70年代、2回目は80年代。計算機の能力が上がってきたから何かできるだろうなと思ったんだけど、やってみたらできなかった時代です。
そして、ニューラルネットワークとセマンティックWeb2とかの意味理解の原理に影響されて、情報の関係性を解析して検索するGoogleになったりしたんです。もともと人工知能の研究室がスピンアウトしたもので、逆に言うとスピンアウトせざるを得ないくらい期待が下がっていて、検索とか新しい出版といった方便を見つけていったんですね。
みんなニューラルネットワークをやりたかったけど、表立って言うことはできないし、学部も学科もない状態がずっと続いていました。表に出せないけど俺たち実はやっているんだぜ、みたいなモヤモヤした貯金がこの50年貯まっていたから、それがディープラーニングでうまくいくぞと分かった瞬間にみんなでどっと出てきたんです。
私は大学にいてもやりたい研究をさせてもらえない、この研究に人生ささげても死ぬまでに成果出ないかもしれないと思ったんですよね。もうちょっと手っ取り早くお金が儲けられるゲームの世界に行きました。ニューラルネットワークがディープラーニングのテクニックで補完されることによって、急激に良くなりました。やっとその実用性が認められて、わかりやすい成果が出てきて、急激に進化したように見えたんです。ニューラルネットワークの発想そのものは正しかったわけです。
― ニューラルネットワークが、ディープラーニングのテクニックによって補完された?
清水:
そうです。ディープラーニングはテクニックであって、技術ではない。考え方ではなくやり方で、ニューラルネットワークの学習をさせる方法がディープラーニング。ディープラーニングは手数が大事です。「たくさんサイコロを振ったらいい奴ができた」というわけなんですよ。
これは、人間の教育問題とも似ていて、才能のある人に教え続けても必ず賢くなるという保証はありません。最初から点数良い人って逆に学習するチャンスが少ないから、早熟の天才は伸び悩むことがあります。人工知能も学習初期にすごく良い点を取ると、そこから向上心がなくなってしまうことがあります。向上心と言うとちょっとポエティックすぎるけど、間違えないと学習できないんです。
― 学習が袋小路に入っちゃう。
清水:
そうそう、局所最適化になってしまうんです。すぐ75点取った奴が頑張って学習して80点になったけど、最初20点しか取れなかった奴が同じ学習時間で95点取れるようになる、ということも起きます。
清水:
ある組織に「天才過ぎる」人がいると、うまくいかないことがあります。その人が天才過ぎることが早々に証明されてしまうと、その人が間違ったことを言っても「あの人、天才だから」と従ってしまいますよね。「俺は凡人だから、天才の言うことが理解できないからダメなんだ」とやりだすと、うまくいく時期もあるけど、ダメになる時期もあります。
― 成功体験に頼ってしまうんですね。
清水:
天才的アイデアでとあるゲームをヒットさせた友人が、一発目のヒットが終息していき、本当にお金が無くなり、人がどんどん離れていきました。そして友人は、「ヤバい!」と思ったらしく、会社の中で全員が「私の目は節穴で申し訳ないんですが、こう思っています」と言うルールにしたんです。節穴だから、面白いかどうかは判断できない。主観は一切排除して、20人の社員が20個のゲームを1面だけ作ってすぐ出してしまう。1日で目標が達成できたら、じゃあ3面まで作ろう、1週間見よう、3週間見よう、と。そうやって単なる多産多死を繰り返して指標だけを測っていった結果、全米トップを半年間で2回獲ったんです。この話を聞いて僕が思ったのは、これはもはや、組織管理のニューラルネットワーク化です。
― コンピューターは意味も価値も理解していなくて、とにかく総当たりでやって結果が良いものを選択するのがディープラーニング。それと同じことを人間がやるんですね。
清水:
企業文化は真似しようとしても難しい。その会社では、当たった人を高く評価するのではなく「お前が当てたのは俺が外したおかげ」「俺が当たったのはみんなが外したおかげ」と考える。サッカーのチームプレーも同じです。キーパーやフォワードだけが頑張っても勝てない。誰が良いパス出したとか、いいとこで止めたとか、こいつピンチに強いとか、多様性の方を重視しないといけない。話を戻すと、ディープラーニングはたくさんの機械で同時に試すのが良いというのは、こういうことなんです。
聞き手 大貫 剛(ライター)
ギリア 株式会社 https://ghelia.com/