⏩ タンパク質の構造や DNA との相互作用の理解は創薬に不可欠
⏩ 画像生成 AI 技術でこれまでのプロセスを簡素化
⏩ 莫大な商業的利益が期待、食料安全保障にも資する可能性
2024年5月8日(現地時間)、Google の AI 研究開発部門・Google DeepMind(以下、DeepMind)が新しい AI モデル・AlphaFold 3 を発表した。
DeepMind のスピンアウト企業・Isomorphic Labs と共同開発された同モデルは、タンパク質の 3D 構造を予測するモデルの最新版であり、創薬や医療分野で革命をもたらすとも言われる。
Isomorphic Labs(同社サイトより)
DeepMind は、2016年から AlphaFold の開発に取り組み始め、2018年に初公開した。その後、2020年にタンパク質の形状を予測するモデル・AlphaFold 2 を公開し、科学界50年来の課題を解決するツールとして驚きをもって受け止められた。
そして今回発表された AlphaFold 3 は、この取り組みをさらに前進させるものだ。DeepMind のデミス・ハサビスCEO は、その進化が「莫大な商業的価値」を生み出す可能性があると語っている(太字は引用者による、以下同様)。
なぜ、AlphaFold 3 は創薬に革命をもたらし、科学の扉を開くと言われているのだろうか。
何がすごいのか
AlphaFold 3 の革新性を理解するためには、タンパク質について簡単に把握しておく必要がある。
タンパク質の基本事項
前提として、タンパク質は生物を動かす極めて小さな分子だ。それはねじれたり、折りたたまれて、他の分子と相互作用する。
そのため、ワクチンや薬などを作る際には、(1)タンパク質の構造を明らかにすること(2)それが他の分子とどう結合し、構造が変化するかを予測することが求められる。
たとえば、人間の細胞にあるタンパク質が、ウイルスのタンパク質と結合すると、分子の形状が変化してウイルスが人間の細胞に侵入することができる。そのため、タンパク質の構造と変化のプロセスを理解しなければ、ワクチンや抗ウイルス薬を正しく作ることはできない。また、アルツハイマー病の発症にタンパク質が関わっているともされるなど、病気の原因究明にとってもタンパク質は無視できない存在だ。
しかし、タンパク質の構造を明らかにする作業には、これまで大きなコストがかかっていた。タンパク質は、人間の体内だけでも約10万種類、自然界全体では約100億種類も存在するとされているうえに、中には、ねじれたり折りたたまれたて、立体的に組み合わさるものもある。典型的なタンパク質は、10の300乗(*1)の異なる形態をとりうると推定されており、これは宇宙に存在する原子の数よりも多い。
ヘモグロビンの構造。人間の赤血球に含まれ、酸素を運ぶヘモグロビンもタンパク質の一種(Benjah-bmm27, Public domain)
そのため、タンパク質が本当に結合するのか、どのように結合するか、どのような形状に変化するかを理解するだけで、数週間から数か月、場合によっては数年かかっていたという。
(*1)Google の名前の由来になった Googol は、10の100乗をあらわす単位
AlphaFold の革新性
DeepMind が2020年にリリースしたモデル・AlphaFold 2 は、前述した(1)タンパク質の構造を数日で予測し、その精度も電子顕微鏡や X 線を使う従来の方法より格段に高く、50年来の課題(*2)を解決するツールだとして研究者たちを驚愕させた。