Stable Diffusion 3.5
10月22日、Stability AIは最新の画像生成AIモデル「Stable Diffusion 3.5」を発表しました。このモデルは、前バージョンStable Diffusion 3が大コケしたので、ライセンスや技術面での大幅な改良が施され、より高品質で多様な画像生成が可能になりました。また、ユーザーのニーズに合わせて異なるモデルを選択できるようになり、使用環境や目的に応じた柔軟な運用が可能になっています。
Stable Diffusion 3.5 Large:80億のパラメータを持ち、1メガピクセルの高解像度画像生成に対応しています。プロフェッショナルな用途に最適で、プロンプトの忠実度において業界トップクラスの性能を実現しています。
Stable Diffusion 3.5 Large Turbo:Largeモデルの高速処理版で、わずか4ステップで高品質な画像を生成します。処理速度を大幅に向上させながら、品質を維持しています。
Stable Diffusion 3.5 Medium:26億のパラメータを持ち、一般消費者向けハードウェアでの実行に最適化されています。0.25から2メガピクセルまでの解像度に対応し、カスタマイズのしやすさと画質を両立させています。
ライセンスも非営利目的での利用は完全無料で、年間収益100万ドル未満の商用利用も無料で可能です。
さっそくStable Diffusion 3.5 Mediumをローカル入れて、試した画像がこちらです。
どうでしょうか。AIで生成するとほぼ美女ばかりでそれがAI画像ぽさにもなるのですが、SD3.5で生成したこのAI女性はよく町中でも歩いてそうな女性だと思います。このあたりは評価が分かれるところですが、AIモデルぽくなくて僕はいいと思います。
元Stable Diffusion開発者らが手がける「FLUX.1」(120億パラメーター)と比較をされていますが、両モデルとも高品質な画像生成が可能です。
プロンプトの忠実度や生成速度、ハードウェア要件や好みなど、用途や環境に応じて適切なモデルを選択していけばよいと思います。
-
前の記事
オープンソースで高性能な動画生成AIモデル『Mochi 1』 2024.11.07
-
次の記事
スマートグラスで個人情報を「透視」。 2024.11.21