Midjourney や Stable Diffusion などの画像生成AI が、まるで人間が描いたかのような高品質の画像を生み出すことが話題を呼んでいる。同時に、これらの画像生成AI が侵害しうる権利や倫理に関する議論についても盛んになっている。
英・The Economist 誌は、6月発行の誌面で Midjourney によって生成された画像を表紙に選んだ。また、米コロラド州で開催されたアートコンテストでは、Midjourney によって生成された絵画が優勝(デジタルアート/デジタル処理フォトグラフィー部門)して物議を醸した。
コロラド州のアートコンテストで入賞した画像(Discord)
日本でも、9月に静岡県を中心に甚大な被害をもたらした台風15号に関連して、同県内で発生した水害の空撮画像のような偽画像が、Twitterで拡散された(下図)。投稿者は「静岡」「水害」というワードを英語でAIに指示して水没した街の虚偽の画像を生成したことを認めた。
画像生成AI の広まりは、AI が急速にクリエイティブの現場に進出する起点にもなっている。例えば、テキストを入力するだけで動画編集が可能な AIツール Text to Video は近いうちにサービスを一般公開すると予告しており、Facebook などの Meta も Make-A-Video を発表している。画像の生成に限らず、動画や音楽など、様々なクリエイティブの領域に技術の応用が期待されている状況だ。
画像生成AI はどのようなもので、なぜ今これほどまで議論を呼んでいるのだろうか?
画像生成AIとは
Midjourney や Stable Diffusion のような画像生成AI とは、どのような技術なのだろうか?
テキストから画像を生成するAI
Midjourney や Stable Diffusionは、いずれもユーザーが指定したテキストをもとに画像を生成するAIだ。
今年7月、一足先にベータ版としてリリースされた Midjourney は、NASA(アメリカ航空宇宙局)の技術者も務めたデイビッド・ホルツ氏が代表を務める AI 研究チームが開発した画像生成AI だ。それが生み出す画像の芸術性の高さゆえに「神絵を描くAI」として話題を呼んでいる。
続いて、8月22日のオープンソース化により一般ユーザーも使用できるようになった Stable Diffusionは、Midjourney と同様に入力されたテキストから画像を生成する。その精度は Midjourney を含むこれまでの画像生成AI を超えるとも言われている。
これらはいずれも無料、または低価格で誰もが利用できる。ユーザーが生成した画像は、続々とソーシャルメディアなどに公開されており、出力される画像の品質を左右する「指定するテキスト」のアドバイスなども数多く出回っている。
技術
Midjourney や Stable Diffusion では、いずれも膨大な量の画像データをAIに学習させることで、高度な画像生成を可能にしている。
例えば Stable Diffusion は、NVIDIAのA100 PCIe 40GBタイプを8台搭載したマシンを32台繋ぎ、20億枚もの画像とキーワードのペアを学習している。その計算にはAWS(アマゾン・ウェブ・サービス)を用いることで、延べ117万ステップ、15万時間が費やされている。
同様の画像生成AI としては OpenAI による DALL-E 2(2022年4月)、Google による Imagen(2022年5月)と Parti(2022年6月)などが挙げられる。しかし、DALL-E 2はウェイトリストに登録されたユーザーを順次招待する形で利用に制限をかけ、Google はフェイクニュースやリベンジポルノに悪用されるへの懸念などから公開を控えてきた。背景には、画像生成AI が社会にもたらす影響が大きすぎるという懸念があった。
しかし9月28日、OpenAI は DALL-E 2の初期版である DALL-E を、ウェイトリストへの登録有無にかかわらず一般利用可能としたことを発表した。これまで躊躇されることも多かった画像AI のサービス利用だが、今年後半に入ってから続々と市場に投入されている状況だ。
画像生成AIをめぐる権利の議論
画像生成AIは、これまでも商用向けに利用されてきた。しかし、Midjourney や Stable Diffusion などを通じて、一般ユーザーが低コストで利用できるようになり、いわゆる「AIの民主化」の火付け役となったことが重要な意味を持つ。
こうした中で、様々な権利や倫理に関する議論が広がりを見せている。
著作権
まず注目されるのが、画像生成AIをめぐる権利や法律に関する論点だ。中でも著作権をめぐっては、多くの専門家から懸念の声が上がっている。
著作権については、その論点を2つに分類することができる。1つ目が、AIの学習に用いられる膨大な画像の著作権について、2つ目がユーザーの指示をもとにAIが生成する画像の著作権についてだ。