最近、ChatGPTをはじめとする「ジェネレーティブAI」が話題になっています。日本語で指示を出すだけで文章や画像、プログラムなどをAIが次々に生成していくさまに、多くの人が驚いています。
ジェネレーティブAIは、写真の世界も無縁ではありません。複数の視点から撮影した画像をもとに、AIが3Dの世界を生成する「NeRF」(ナーフ)という技術があります。2022年3月には、GeForceシリーズでおなじみのNVIDIAがNeRFを手軽&高速に実行する「Instant NeRF」(インスタントナーフ)を技術カンファレンス「GTC 2022」で発表し、多くの人が利用できるようになりました。
写真の常識を変えそうなInstant NeRFですが、間もなく開かれる「GTC 2023」で大きな進化を遂げる可能性があります。その前に、Instant NeRFの実力を試してみました。
複数枚の画像の情報をもとに、AIが3D空間を生成する
Instant NeRFをとてもシンプルに解説すると、複数の視点から撮影した2Dの写真をもとに、AI(機械学習)による分析や処理を加えることで、3Dの世界を生成する技術です。特筆すべき点が、撮影していないアングルの情報も機械学習の力で生成できることにあります。
試しに、iPhoneで撮影した数十枚の写真をもとに、Instant NeRFで動画を生成してみました。撮影できていないはずのアングルも含め、まるでドローンを飛ばしたかのように新たな視点の動画があとから自在に生成できたことが分かります。撮影していないアングルは霞がかったボンヤリとした表現になるものの、動画になるとかなり自然な印象で描写されるのに驚きます。
ざっくりとした作業の流れは、まず素材となる写真を用意し、Instant NeRFのプログラムに読み込ませます。さらに、機械学習による処理を加えていくことで、撮影できてない領域を生成したり、被写体や風景をより鮮明に仕上げていきます。ある程度処理が済んだ段階で、どのようなアングルで見せるのかを指示していくことで、ドローンを飛ばしたような動画が生成できる仕組みです。
最上級ゲーミングPC並みの性能と、相応のPCのスキルが必要
Instant NeRFがやっかいなのが、機械学習のために高性能なグラフィックスカードが欠かせないこと。Tensorコアを搭載したGeForce RTXシリーズが必要になり、試そうと思うと最上級ゲーミングPCを購入するぐらいの予算が必要になります。もちろん、GeForceを搭載していないWindowsパソコンやMacでは実行できません。
今回は、日本HPのクリエイター向けデスクトップ「HP ENVY TE02」を借りて試しました。Core i9とGeForce RTX 3080 Tiを搭載した満艦飾的な仕様だったので40万円近くしてしまいますが、CPUやグラフィックスカードのランクを落とせば20万円台で落ち着きそうです。ただ、グラフィックスチップの性能が機械学習の処理速度を大きく左右するようなので、グラフィックスカードはできるだけ高性能のものを選んでおいた方がよさそうです。
さらに、Instant NeRFはプログラムの導入や実行が難しいことも挙げられます。一般的なWindowsソフトのようにインストーラーが用意されていたり、マウスで簡単に操作できる仕組みにはなっておらず、コマンドをあれこれ入力する必要があります。
大幅に使いやすくなったInstant NeRFが登場するか?
このように、現時点ではPC環境が整っていて専門知識のある人でないと扱えないInstant NeRFですが、近いうちにグッと身近な存在になる可能性も秘めています。
Instant NeRFが発表されたのは、2022年3月に開かれたNVIDIAの技術カンファレンス「GTC 2022」の基調講演です。実は、今年の「GTC 2023」の開幕が3月21日に迫っていて、基調講演は3月22日の午前0時(日本時間)に開かれます。基調講演ではジェネレーティブAIの説明に多くの時間が割かれるようで、この場でInstant NeRFのアップデートが発表される可能性があります。AIが写真の世界も劇的に変えるか、注目したいと思います。