「Veo3」と「Sora2」を比較してみた。

少し前のブログにSora2に関して書きましたが、AIによるコンテンツ生成は新たな時代に突入して、ネット上ではSora2の話題が非常に多いです。最近はGoogleの「Veo3」とOpenAIの「Sora2」の比較などもされていて、実際「どちらが優れているのか?」「自分の仕事にはどちらが役立つのか?」と疑問に思う方もいるかと思います。
今回は両方いじってみて、僕の感じたことを書いてみたいと思います。まずは、実際に僕が制作した動画を見てみてください。
Veo3はリアルな人物像の画像がアップ出来てそれを動かすことが可能でしたので以前このブログでもお見せした画像を上げてしゃべらせました。一方、Sora2ではリアルな人物の画像がアップできないので、適当な日本人女性の画像を作ってもらいました。
Veo3では日本語が崩れますね。またプロンプトに書いたセリフ通りの言葉をしゃべってくれません。Sora2はほぼこちらの書いたセリフ通りに日本語を話してくれます。それに日本語も自然です。動画自体はVeo3の方が崩壊も少なく自然な感じです。Sora2は手元が少し崩壊しますし、全体的にぼやけている印象です。
同じく「Veo3」と「Sora2」で居酒屋で女性が飲んでいるところを生成しました。Veo3は音が生成されませんでしたが、Sora2はこちらも完璧にセリフが再現さえれます。やはり動画としてはVeo3の方がより自然な印象を受けます。
ちなみにSora2も動きがあまりないと下の動画のように崩壊がなく良い感じになります。セリフも台本通りです。
実際に試したのと同時に様々な比較検証の動画などを見て感じたことは、Veo3は映像がSora2より綺麗なこと、物理法則に忠実なリアルな動きの再現性においても、Sora2より高いと感じました。
カメラワーク、つまり 「パン」「チルトアップ」「ドリー」といった具体的なカメラワークの指示には、Sora2の方が反応していました。
Sora2は無料プランではウォーターマーク(透かし)が入りますが、両者ともにAPI経由や有料プランを利用することでウォーターマークなしの動画を生成でき、商用利用も可能です。
Veo3とSora2は単なる優劣ではなく、それぞれが得意分野を持ちます。お勧めの使い分けとしてはSora2は、画質が少し悪いですが日本語も自然にほぼ完ぺきに台本通りに言えるので、ちょっとしたTikTokやInstagramリール向けには良いと思います。
Veo3は美しい風景や人物などの再現力が高いと思いますので少しロングなCM的な動画に利用できるかと思います。ただし、セリフやBGMなどが生成されないときもありますので編集ソフトを利用できた方が良いかと思います。
今年に入りまして生成動画が劇的に進化しました。これは業界にとって脅威にもなりますし、チャンスにもなります。当社としてはチャンスとしてとらえていきたいですね!
-
前の記事
OpenAI DevDay 2025 2025.10.09
-
次の記事
記事がありません