Google Cloudは12月4日、Vertex AIにおいて動画生成モデル「Veo」のパブリックプレビューを開始するとともに、画像生成AIモデル「Imagen 3」の提供を間もなく開始することを発表した。
VeoとImagen 3は、今年5月に開催されたテクノロジーカンファレンス「Google I/O 2024」で発表された最新のAIモデルである。
Veoは、シンプルなテキストや画像のプロンプトを用いて、高品質な動画を容易に生成できる。Runwayの「Gen-3」やOpenAIの「Sora」といった動画生成モデルと競合する製品である。自然言語と視覚セマンティクスの高度な理解に基づき、プロンプトのニュアンスやトーンを的確に捉え、クリエイターが求める高度なクリエイティブ・コントロールを可能にする。また、フレームレベルでの一貫性を特徴とし、人物や動物、オブジェクトがショット全体を通じてリアルに動く点が強みである。
Veo: our most capable video generation model is now available on Vertex AI in private preview!
Developed by @GoogleDeepMind, Veo generates high-quality videos based on text or image prompts in a range of cinematic & visual styles with exceptional speed → https://t.co/ZXTIHYRSPr pic.twitter.com/vYsmqALjAa
— Google Cloud (@googlecloud) December 3, 2024
Imagen 3は、前世代モデルと比較して、髪の毛一本一本や服の質感など、より細部まで表現できる。光の当たり方や影の描写もより自然になり、アーティファクトが減少し、生成画像のリアリティが大幅に向上している。
Vertex AIは、機械学習のフルマネージド型プラットフォームであり、モデルの開発から運用までを一貫して行える統合環境を提供している。Google Cloudは、同社のAI原則に基づき、Vertex AIのVeoとImagen 3を構築している。これらには電子透かしや安全性フィルターが組み込まれており、著作権に関する補償も提供されている。この包括的なツールスイートを活用することで、企業や組織はマーケティングや営業をはじめ、さまざまな分野で安全に生成AIを用いた効率的なコンテンツ制作を実現できる。
例えば、Imagen 3を用いることで、企業はマーケティングや広告、製品デザインに活用できる高品質な画像をシームレスに作成できる。独自のブランドスタイルやロゴを反映させた画像の生成も可能であり、Google Cloudは許可リスト登録ユーザー向けに画像の編集やカスタマイズ機能を提供する。さらに、それらのビジュアルをVeoで洗練された動画に変換するなど、新たなクリエイティブの可能性が広がっている。