⏩ 初期は方向性も定まらなかったが、伝説的研究者の登場が転機に
⏩ アルトマンのフルコミット後は、3つの矛盾とともに急成長
⏩ それぞれがもたらした副作用に直面も、歩みは止めず
2024年10月、OpenAI は66億ドル(約9,600億円)の資金調達を発表し、その企業価値は1,570億ドル(約23兆円)に達した。
OpenAI とサム・アルトマンの歴史を扱った前編記事「サム・アルトマンとは誰か?AI の王様、終末の預言者の矛盾に満ちた素顔」では、同社のCEO であるアルトマンのパーソナリティーを概観した。
後編の本記事では、OpenAI 設立後に焦点を絞り、同社の成長とアルトマンの動きを概観する。
たしかに、OpenAI を近年最も成功したスタートアップに仕立て上げた張本人は、アルトマンだろう。しかし、「未来が見える」と言われる彼でさえ、当初は OpenAI が進むべき道筋を明確に示せていたわけではなかった(太字は筆者による、以下同様)。
では、OpenAI はいかにして LLM の研究に集中するようになったのだろうか。そして、アルトマンは、どのようにして小さなラボを23兆円企業へと育て上げたのだろうか。
誰も何をすべきか分からなかった
2015年12月11日、非営利法人 OpenAI が設立された。設立に至る経緯については、本誌で以前報じた「サム・アルトマンとは誰か?」に詳しい。
設立当初の OpenAI は、リーダーたちも含めて誰も向かうべき方向性を示せなかった。オフィスもなかったチームは、とりあえず、当時 CTO だったグレッグ・ブロックマン(現社長)のアパートに集合した。アルトマンはこの時、「何をすべきなんだ?」と思ったと回想している。
最初のオフィスはブロックマンの自宅だった(Greg Brockman)
そのため、初期の OpenAI では各々のメンバーが自由に研究をしていた。たとえば、ゲーム AI や、ルービックキューブを解くロボット開発だ。当時についてブロックマンは、「(OpenAI の研究開発は)何も機能していなかった」として、成果をあげられなかったと認めている。
ロボットの手がルービックキューブを解く映像
なお、ゲーム AI に関する大きな成果は、2019年4月を最後に発表されておらず、ロボット工学チームも2020年10月に解散した。振り返ってみれば、これは同年5月にGPT-3が発表された後の出来事だった。
2016年、進むべき方向を見出せない状況が変わり始める。この年、後に OpenAI が大規模言語モデル(LLM)開発に向かうきっかけを与えた人物が入社した。
礎を築いた無名の伝説的研究者
OpenAI が LLM 開発に注力する契機となったのは、アレック・ラドフォードという研究員が2016年4月にジョインしたことだ。
彼は、後に発表される GPT-1(2018年)と GPT-2(2019年)の研究において、それぞれの論文の筆頭著者を務めた。彼こそ、OpenAI が LLM の開発に乗り出す礎を築いた人物と言えるだろう。
アレック・ラドフォード(X より)
ラドフォードは、最も影響力を持ちながら、最も認知されていない人物だと一部で評されており、「伝説的な地位を獲得している」とも言われる。
大袈裟に言えば、彼の参加がなければ、OpenAI が LLM に注力することはなかったかもしれない。少なくとも、そのビッグウェーブに乗り遅れていた可能性は否定できない。
そして、この伝説的研究者が OpenAI にやって来た背景には、現在同社への投資をおこない、半導体分野の世界的リーダーである Nvidia の(意図的ではない)影響が関係している可能性がある。
伝説的研究者が OpenAI に来た理由
ラドフォードは元々、東海岸・マサチューセッツ州のオーリン工科大学の学生だった。学生時代の2014年、友人らとともに Indico というスタートアップを創業している(現在でも、同社のアドバイザーを務めている)。
彼は同社で、OpenAI が設立される以前から、テキストを画像に変換する技術の開発を試みていた。たとえば、2015年10月のラドフォードの投稿(下)には、「テキストから画像への変換は機能しています(ある程度は)(まだ悪い)」と書かれており、テキストとそれに基づいて生成された画像が見られる。
転機は2016年4月、 Nvidia のジェンスン・フアンCEO による年次基調講演だったと言われている。
同講演の中で、フアンCEO が、Facebook(傘下のヤン・ルカン研究室)による研究を紹介した瞬間が決定的だった。この研究は、単純なテキストをプロンプトとして油絵のような画像を作れるという、現在の画像生成 AI につながる技術を扱っている。そしてこれは、ラドフォードが主導した研究成果だったのだ。
フアンCEO による年次基調講演の様子。左下のスライドにラドフォードの名前はない(YouTube 動画のスクリーンショット)
ラドフォードにとって問題だったのは、その研究の著者名だ。講演で用いられたスライド(画面左下)に著者名としてあげられているのは、Soumith Chintala という Facebook の研究者のみで、そこにラドフォードの名前はない。だが、実際の研究論文(下)を見れば分かるように、この研究の筆頭著者は、ラドフォードと同僚のルーク・メッツだ(*1)。
2016年1月に発表された論文、筆頭著者はラドフォードとメッツで、Chintala はメンターとして研究に参加していたという(”Unsupervised Representation Learning with Deep Convolutional Generative Adversarial Networks” よりスクリーンショット、強調は筆者による)
ラドフォードとともに Indico を創業したスレイター・ヴィクトロフは、Boston Globe 紙に対し、Nvidia による扱いが「アレックが(東海岸を)去った大きな理由でした」と語っている。とはいえ、ラドフォードの研究を進めるためには、大規模なリソースが必要だったため、彼はそれを求めて西海岸に移ったという見方もある(*2)。
いずれにせよ、「ある種の大学院プログラムに参加するようなものだった」と語るラドフォードは2016年4月、OpenAI に入った。
(*1)ちなみに、メッツはその後 Google Brain(現 Google DeepMind)で働いた後に、2022年から OpenAI に入社した。そして、2024年10月9日に退社を発表している。
(*2)ただ、ラドフォードの OpenAI 参加については、時系列の混乱が見られる。Boston Globe 紙の記事では、彼がフアンCEO の講演を見た「すぐ後に」OpenAI にジョインしたとしている。しかし、 OpenAI は同講演前の2016年3月31日時点で、ラドフォードの雇用を発表しており、Nvidia の扱いが、どの程度彼のキャリアに影響を与えたか定かでない部分もある。筆者はこの件について、当該記事を執筆した Boston Globe 紙の記者に問い合わせたが、現時点で回答は得られていない。
Microsoft との連携開始
ラドフォードの参加によって、OpenAI が LLM に取り組む土台が築かれたことは間違いないだろう。
それを傍証するかのように、ラドフォードが入って7ヶ月後の2016年11月、OpenAI と Microsoft の連携が発表された。AI モデルを大規模に訓練するため、Microsoft の Azure 上で実験を開始したというものだった。後の Microsoft と OpenAI の親密な関係は、この頃から形成されていた。
ただ、ラドフォードが話しているように、当時の言語モデルは「目新しいおもちゃ」のようなものと見られており、その精度は低かった。
それでも、ブロックマンや主任研究者のイリヤ・サツケヴァーは、ラドフォードの好きなように研究を続けさせた。そして、ある論文の登場により、ラドフォードの進めていた言語モデル研究は一気に花開く。
トランスフォーマーの登場
2017年6月、Google の研究者たちが新しい論文を発表したことで、言語モデル研究に革命が起きた。この論文で、トランスフォーマーと呼ばれる、新しいディープラーニングの方式が発表されたのだ。
トランスフォーマーについて発表した論文。2023年7月までに、8名の共著者全員が Google を退社している(”Attention Is All You Need” よりスクリーンショット)。
簡単に言えば、トランスフォーマーが革新的だった点は、文脈の違いに応じて言葉の意味を捉えられるようになったことだった。これを理解するために、「はし」という単語を使った次の3つの文章を見てみよう。
例文1:私は、はしで寿司を食べました。
例文2:私は、川にかかるはしを渡りました。
例文3:私は、棚のはしに本を置きました。
ある程度の日本語話者であれば、それぞれの「はし」が、箸・橋・端を意味していると理解できる。なぜなら、「寿司を食べる」や「川にかかる」あるいは「棚に置く」という前後の言葉に注意を向け、それらをヒントに「はし」の意味を判断できる(つまり、文脈を読み取ることができる)からだ。
しかし、トランスフォーマー以前の AI モデルは、前から順番に単語を処理していたため、文全体を見渡すことができなかった。たとえば、「私は、はしで寿司を食べました」という文章では、「はし」を処理した後、続く「寿司を食べる」といった文章理解のヒントに注意を向けることができず、本来「箸」と理解すべきところを「橋」や「端」と誤解してしまっていた。
以上を踏まえれば、トランスフォーマー論文のタイトルが “Attention Is All You Need”(必要なのは注意だけ)とされた理由が分かる。すなわち、文章全体でヒントとなる単語(寿司や川)へ自動的に Attention(注意)を向けさせることができれば、言語モデルは言葉の意味を正しく理解できるのだ。
そして、この画期性を真っ先に見抜いた数少ない人物の1人が、OpenAI の主任研究者であるイリヤ・サツケヴァーだった。
革新性を見抜いたサツケヴァー
トランスフォーマー論文の革新性にもかかわらず、当初それを見抜けた人物は決して多くなかった。
論文の発表元である Google のスンダー・ピチャイCEO でさえ、「私たちはそれ(トランスフォーマー)が本当に機能するか、はっきり分からなかった」と語る。アルトマンも、「トランスフォーマー論文が発表された時、Google の誰一人として、この技術が何を意味しているか理解していなかったと思う」と述べている。
一方の OpenAI、特に主任研究者であるイリヤ・サツケヴァーは、真っ先にトランスフォーマーの革新性を見抜き、その技術に飛びついた。ブロックマンは当時の様子について、次のように振り返る。
本当のアハ・モーメントは、イリヤがトランスフォーマーの登場を見たときでした。彼は、「これこそ私たちが待っていたものだ」といった感じでした。
ブロックマン(左)とサツケヴァー(右)(Greg Brockman)
サツケヴァーは、言語モデルの研究をしていたラドフォードに対し、トランスフォーマーの技術を取り入れるように促す。そしてラドフォードは、この革新性を最大限活用するためには、大規模なデータセットとコンピューティング能力で、モデルを訓練する必要があると気が付いた。
これは同時に、OpenAI にとって、カルチャーの変革が必要であることを意味していた。大規模にモデルをトレーニングをするのであれば、プロジェクトの規模も大きくなる。そのため、従来のように各メンバーが好きな研究をするのではなく、統制の取れたチームを形成する必要があるということだ。今も理事会のメンバーであるアダム・ディアンジェロ(Quora のCEO)は、同社を「スケールアップ」して、「もっとエンジニアリング組織のように運営する必要」があったと語る。
ところが、カルチャーの変化が求められ始めた矢先、OpenAI は内紛に直面する。
内紛
内紛とは、OpenAI 設立で中心的な役割を果たしたイーロン・マスクと、アルトマンやブロックマンらの対立だ。トランスフォーマーに革新性を見出した OpenAI のメンバーとは裏腹に、当時のマスクは焦りを募らせ、結果的に内紛へと至った。
Tesla の工場で話すアルトマン(左)とマスク(右)(2016年)(YouTube 動画のスクリーンショット)
マスクの念頭にあったのは、Google の支配力だ。2014年に AI 研究で名高い DeepMind を買収した Google は、2015年から18年頃にかけて次々と成果を発表していた。人間のトップ棋士を次々に倒した囲碁プログラム・AlphaGo が注目を集めたのも、この時期だ。
一方、Google に比べて、大きな進捗のない OpenAI にマスクは苛立ちを隠せなかった。焦ったマスクは、自ら陣頭指揮を執ろうとしたり、株価の暴落に見舞われていた自身の EV 企業・Tesla の傘下に OpenAI を組み込もうとした(*3)。
マスクは実際に、その試みを示唆する動きを見せていた。2017年6月、OpenAI の優秀な研究者であるアンドレイ・カルパシーを Tesla に引き抜いたのだ。
(*3)当時の Tesla は、新型モデル・Model 3 セダンの製造ペースが上がらず、製造目標を大幅に下回るなど苦戦を強いられていた。
マスクと OpenAI のメール
さらに、当時 OpenAI とマスクの間で交わされたやり取りも、Tesla による OpenAI の吸収を示唆している。
OpenAI が公開しているマスクからのメール(下図)には、「私と◼️◼️◼️の意見では、(OpenAI にとって)Tesla は Google に匹敵する望みがある唯一の道」と書かれている(伏せ字になっている人物は、マスクの知人と見られる)。
2018年2月1日にマスクから、サツケヴァーとブロックマンに送信されたメール(OpenAI よりスクリーンショット、強調は筆者による)
このメールには、伏せ字になっている人物からマスクに送られたメッセージ(下図)も含まれていた。その人物は、マスクに対し「OpenAI が Tesla のドル箱として提携することが最も有望な選択肢だと思う」と提案している。
2018年1月31日、伏せ字の人物からマスク宛てに送付されたメール(OpenAI よりスクリーンショット、強調は筆者による)
しかし、こうしたアイデアは、アルトマンやブロックマンを含めた従業員たちから反対された。結局、 AI 部門を抱えていた Tesla との利益相反になるという理由で、2018年2月に、マスクは OpenAI を去ることとなった。
この時、別れの挨拶に来たマスクと従業員の間で、一悶着あったという。OpenAI の若い研究者がマスクに、あなたの計画は無謀だと歯向かうと、苛立ったマスクは、その研究者を「のろま」(jackass)と罵った。 その後同社の幹部によって、jackass と書かれたトロフィーが置かれたが、これについてアルトマンは、「少しは楽しまないと。カルチャーはこういうものから生まれるのです」と語っている。
リード・ホフマンの援助
マスクの離脱は、メンバーの給与や莫大なトレーニングコストを負担する資金提供者を失ったことを意味していた。新興メディア・Semafor によれば、マスクは、同社を去る前に約1億ドル(約140億円)を拠出していた(*4)。
そこに手を差し伸べたのが、LinkedIn の共同創業者で、OpenAI 設立時にも資金提供していたリード・ホフマンだ。ホフマンは、マスクが去った後の OpenAI に対し、当時数十人いた従業員の給与を支払うために資金援助したと認めている。
2017年、イベントに登壇したアルトマン(左)とホフマン(右)(YouTube 動画のスクリーンショット)
この時ホフマンは、アルトマン、ブロックマン、サツケヴァーと話し合いの場を設け、自分は正しいことをしているという大きな自信があると伝えた。
2018年2月のマスク退社後、ホフマンからの支援で何とかつなぎの資金を確保した OpenAI は、LLM の研究を進化させていく。
(*4)ただ、マスクは一時、OpenAI に10億ドル(約1,400億円)の資金提供を約束していたという。
GPT の発明
2018年6月、OpenAI の研究者たちが「生成的事前トレーニングによる言語理解の改善」と題する論文を発表した。
これは、後に ChatGPT へ結実する LLM の初期バージョン・GPT-1 が発明されたことを示していた。前述した通り、この論文の筆頭著者がラドフォードであり、彼は、2019年2月の GPT-2 を発表する論文でも筆頭著者を務めている。
GPT-1 を紹介した2018年の論文。筆頭著者にラドフォードの名前がある(”Improving Language Understanding by Generative Pre-Training” よりスクリーンショット、強調は筆者による)
アルトマンは、GPT-2 を見たことが衝撃だったという。彼は、「これは本当に、私の人生のすべてを支配することになるだろうと思った」と回想する。また、「OpenAI がこの SF のような AI の夢を実現する本当のチャンスがあると確信してからは、他のことをやる気が起きなくなってしまいました」とも話している。
アルトマンが外した予想
しかし、アルトマンにとって、こうした AI の発展の仕方は自らの予想を超えた出来事だった。彼は、後に Wired 誌のインタビューに対し、次のように答えている。
AI について多くの時間をかけて空想していた10歳の私に、これから何が起こるかと尋ねたら、私のかなり自信を持った予測は、まずロボットが登場し、そしてそれらが全ての肉体労働を行う、というものだったでしょう。その後、基本的な認知に関わる労働(引用者註:知識や情報、知能を用いた労働)を実行できるシステムができるでしょう。それからずっと後、数学の定理を証明するような、複雑なことを実行できるシステムができるかもしれません。最後には、新しいものを創造したり、アートや文章を作成し、これらの非常に人間的なことを実行できる AI が登場します。
それはひどい予測でした。(実際の物事は)まったく逆の方向に進んでいます。
アルトマンが自認しているように、この予測は真反対だ。生成 AI はむしろ、アルトマンが最後の段階だと予想していたアートや文章の生成から始まり、その後数学の定理を証明したり推論をする段階に進んでいる。ロボットは、まだ全ての肉体労働をおこなっていない。
したがって、「未来が見える」と言われるアルトマンでさえ、当初は LLM の進化に伴う AI の発展について、正確な見通しを持てていたわけではなかった。
いずれにせよ、アルトマンは GPT-2 発表から1ヶ月後の2019年3月、前職の Y Combinator 社長を退職し、OpenAI のCEO に就任して同社にフルコミットし始める。
3つの矛盾と副作用
本誌が「サム・アルトマンとは誰か?」で報じた通り、アルトマンの投資活動や私生活は矛盾に満ちていると言われる。
それは、OpenAI におけるアルトマンの行動についても同様であり、彼が同社のCEO に就任して間もない頃から、矛盾が囁かれ始めた。裏を返せば、アルトマンはそうした矛盾とともに OpenAI を巨大企業に育て上げたと言えるだろう。
OpenAI とアルトマンが生み出した矛盾は、大きく3つの段階から理解できる。具体的には(1)組織再編と Microsoft からの投資(2)利益指向の加速(3) IPO を見据えた動きだ。そして、これら3つの矛盾の代償として、それぞれに副作用が生じた。