「ディープシーク」の開発コスト。その安さのワケは?
今までAIを作るためには、とにかく膨大なデータを学習させなければいけない。お金もかかる、電気もかかる、データセンターもいる。しかも、そのためにエヌビディアの半導体がいるので、ソフトバンクの孫正義氏が、お金をかけてアメリカに投資するという話が出た。
――チャットGPTの開発。あらゆることをまず学習させるのか。
ライフプロンプト 遠藤聡志CEO:
ネットにあるような、あらゆる情報を取ってきて、AIに入れ込み、学習させていくプロセスを取っている。
――世の中にあるあらゆる情報、飛び交っている会話など、全部学習させると、時間とお金がとてもかかる。
ライフプロンプト 遠藤聡志CEO:
その通りだ。処理のところも大変。計算の面でも、非常に大きなコストがかかるものとなる。
――ディープシークが、安いコストで学習することができた理由は?

ライフプロンプト 遠藤聡志CEO:
一番の肝は、学習手法を改めたというか「報酬の設計」を変えたところだ。これまでは教科書などを与えられて、自主学習に近かったが、最初本を読んでどこから勉強したらいいかわからないような状態だった。ディープシークは、最初に家庭教師をつけるような形で、学習が始めやすくなるような工夫がとられており、安価に早く学習が進むことがあった。「教師あり学習」という手法だ。
――ディープシークは、最初から過去の問題集と答えみたいなものを勉強させる感じか。
ライフプロンプト 遠藤聡志CEO:
はい。どちらも同じような要素は含まれているが、ディープシークの方が、より最初のところでアシストをしていくようなものになる。
――誰でも考えそうに思うが、今までそういうことを考えた人がなかったのか。
ライフプロンプト 遠藤聡志CEO:
これまで、いい計算機があって潤沢な資金とリソースで学習させていたのが、ディープシークの場合は半導体が制限されたことによって、工夫を何かしなければというところで、考え出された工夫のうちの一つだった。
――しかし「家庭教師役」を雇うにもお金かかるのではないか。
ライフプロンプト 遠藤聡志CEO:
「家庭教師役」を作るところにも工夫がされており、トータルで見ると安くなりやすいという方向に転じている。このような先生を作るのは、結構難しかったが、これに対して工夫がされている。
――求めていることだけに、答えを言ってくれるような人であればいいと。
ライフプロンプト 遠藤聡志CEO:
「ちゃんと丸付けをしてくれるような先生」というのをうまく生み出した。

――もう一つ取られた方法が「蒸留」。これはどういう意味か。
ライフプロンプト 遠藤聡志CEO:
「既に存在する先輩」のような生成AIで作った質問と回答のペアを、新しいモデルに転用していくことによって、最初は何を学習したらいいかわからないところから、これも「先生」をつけることに近いが、必要なものだけを学習させること。
――導き出された結果だけを覚えれば良いという事か。そうすると「我々の成果を盗んだ」ということにならないのか?
ライフプロンプト 遠藤聡志CEO:
はい。なので「先輩」となる生成AIのライセンスが非常に重要。無料でオープンソースと言われる「誰でも使っていいよ」というAIを使えば、これは自由にやっていいが、これが「使ってはいけない」という規約になっているものを使うと問題になる。
――だから今、アメリカから盗用疑惑が持たれているのか。

ライフプロンプト 遠藤聡志CEO:
チャットGPTはこれを禁ずるようなライセンスになっている。