小さなな会社の広報戦略室

Googleの動画生成AI「Veo3」も凄いクオリティ

Googleの動画生成AI「Veo3」も凄いクオリティ

どんどん進化しています。Googleが動画生成AIの最新モデル「Veo3」を発表しました。前にこのブログで紹介したGoogleには「Veo2」という優れた動画生成AIがあります。しかし、このVeo3は、そのVeo2をさらにパワーアップさせた、まさに次世代の動画生成AIです。Veo3で製作したデモがありますので是非みてください。びっくりします!

もうヤバいっす!!

そんなVeo3がVeo2と比べて何がどのように進化したのか・・・僕も興味があるので一緒に見ていきましょう。

そもそも「Veo2」はどのようなAIだったのでしょうか?

以前ブログにも書きましたが前身である「Veo2」について簡単におさらいしておきましょう。

Veo2は、テキストや画像から動画を生成できるAIでした。例えば、「夕焼けのビーチを歩く犬」といった文章を入力すると、実際にそのような動画を簡単に作成してくれました。

主な特徴は以下の通りです。

  • 最大4K画質の動画の出力が可能
  • 2分以上の動画を生成可能
  • 「18mmレンズ」などのレンズやボケ感の指定も可能
  • かなりのリアルな映像や、様々な映画のようなスタイル

Veo2も十分に高性能でした。

「Veo3」は何がどのように進化したのでしょうか?

これがVeo3の最大の進化ポイントと言っても過言ではないでしょう。なんと、Veo3は映像と一緒に音声も生成できるのです。

  • 環境音やBGM: 雨の音、街のざわめき、シーンに合った音楽まで生成可能です。
  • キャラクターのセリフやナレーション: しかも、口の動き(リップシンク)も自然に合うというから驚きです。

Veo2は基本的に映像のみの出力だったため、音声は後から別のソフトウェアで追加する必要がありました。しかしVeo3なら、プロンプト一つで、音声も映像も整ったシーンが一度に完成するかもしれません。

Veo3は、映像のクオリティも大幅に向上しています。「息をのむような」と表現されるほど、フォトリアルな映像が生成できるようになりました。

  • 光の表現や質感: より自然で、本物と見間違うほどのクオリティです。
  • 物理法則の再現度向上: モノの動きなども、よりリアルに再現されるようになりました。

Veo2もリアルな映像を生成できましたが、Veo3はさらにその上を行く印象です。特に、キャラクターが話す際の口の動きが自然なため、本当に生きているかのように見えます。

Veo3は、ユーザーが入力するプロンプトをより深く理解できるようになりました。

  • 複雑な指示も対応可能: 「悲しげな表情で窓の外を眺める女性、雨が降っていて、遠くでサイレンの音が聞こえる…」といった、細かい状況設定も的確に汲み取ってくれます。
  • 短い物語なら動画に: 少し長めのストーリーを文章で記述すれば、それを動画にしてくれるというのですから、まるでSFの世界のようです。

Veo2もプロンプトにわりと忠実でしたが、Veo3はさらに賢くなり、作りたいイメージを、より忠実に形にしてくれるようになりそうです。

まとめ

Veo2も素晴らしいAIでしたが、Veo3は「音声との完全な統合」「圧倒的なリアルさ」「物語を理解する賢さ」に進化をし、また一歩動画生成AIの中で頭ひとつでたような感じです。

もちろん、まだ発表されたばかりの技術であり、これからさらに進化していくはずです。しかし、Veo3が示した可能性は僕の想像をはるかに超えるものでした。

いよいよ映画監督やアニメーターでなくても、誰もが頭の中のイメージを、音声も動きも完璧な「作品」として生み出せる。そんな未来が見えたような気がします。

AIの進化からますます目が離せません!