Stable Diffusion 3.5
- 2024.11.14
10月22日、Stability AIは最新の画像生成AIモデル「Stable Diffusion 3.5」を発表しました。このモデルは、前バージョンStable Diffusion 3が大コケしたので、ライセンスや技術面での大幅な改良が施され、より高品質で多様な画像生成が可能になりました。また、ユーザーのニーズに合わせて異なるモデルを選択できるようになり、使用環境や目的に応じた柔軟な運用が可能に […]
小さな会社の社長のつぶやき
10月22日、Stability AIは最新の画像生成AIモデル「Stable Diffusion 3.5」を発表しました。このモデルは、前バージョンStable Diffusion 3が大コケしたので、ライセンスや技術面での大幅な改良が施され、より高品質で多様な画像生成が可能になりました。また、ユーザーのニーズに合わせて異なるモデルを選択できるようになり、使用環境や目的に応じた柔軟な運用が可能に […]
先月末にリリースされましたGenmoのオープンソース動画生成AIモデル「Mochi 1」。画像や動画の生成AIをブログで紹介してきましたが進化の速さに正直追いつくのが大変です。それでも、日々進化するAIを見ているとワクワクが止まらないのでとても楽しいです。 さて、今回も凄い動画生成AIがでてきました。Genmoのオープンソース動画生成AIモデル「Mochi 1」というものです。特徴は従来の動画生成 […]
今日ChatGPTをみたら、新しく検索機能がついてるのを見つけました。調べてみたら、OpenAIが10月31日にChatGPT Searchっていう新機能を発表したみたいです。 この機能のおかげで、ChatGPTで最新のニュースとか情報が直接検索できるようになりました。ウェブの情報とかも見られるし、質問への回答も全部ChatGPT上で済むからめっちゃ便利に! ちなみに、AI検索ツールっていえばPe […]
前に「Adobe Firefly Video Model」のBeta版体験をブログに書きましたが、人間が動いている場合を見てみたいとのリクエストを頂きまして作ってみました。 作業工程は前回と同じです。ImageFXで画像を生成。フォトショップの背景を伸ばすAI機能を使ってサイズをHDサイズに変更。Hailuo.AIで動画に変更。今回はその動画の最初の2秒と終りの2秒を「Adobe Firefly […]
Runwayがまた進歩しました。もう動きが速すぎます! Runwayが開発したAct-Oneです。この技術の一番の特徴は、今まで必要だったモーションキャプチャーを使わずに演技映像から直接アニメーションを生成できるという点です。このおかげで、高価な機器や設備に頼らずに、簡単にアニメーションをスピーディーに制作できるようになります。 Act-Onはさまざまな参照画像に対応しており、リアルな表情を保持し […]
以前にも少しブログで紹介しましたがPremiere Proの Beta版で「Adobe Firefly Video Model」がいじれるようになりましたので早速試してみました。動画を2秒ほど生成AIで拡張できるということなのでその体験をシェアしたいと思います。 今回作った動画は、すべて生成AIを利用して作成したものです。まずimageFXで静止画を作成しました。最初は飛行機と下の街並みだけでした […]
Zoomが新しいAIアバター機能「Custom avatars for Zoom Clips」というものを発表しました。このアバターは、ユーザーの外見や声を反映し、用意した台本に従って話すことができます。似たようなAIアバターは最近でてきてますが、Zoomで簡単に利用できるのがいいですよね。この機能は2025年上半期に利用可能になる予定です。 いくつか使い道が考えられますが、重要な連絡ほど、ただの […]
少し前のブログでAdobeの動画生成AI「Adobe Firefly Video Model」を紹介しましたが、その他にも動画生成AIは進化をしています。今回はメタが最近発表した「Movie Gen」という動画生成AIを紹介します。https://ai.meta.com/blog/movie-gen-media-foundation-models-generative-ai-video/ サンプル […]
昨日GPT-4 with Canvasという機能が追加されているのに気が付きました。まだβ版なのですが結構よい感じです。 Canvasが別ウィンドウで開き、ChatGPTが作成した内容をインタラクティブに修正できます。これは効率をぐっと上げてくれます。生成の精度が向上したということではないらしく、このインターフェースのおかげで使い勝手が向上する感じです。 下記がOpenAIが発表しているGPT-4 […]
課金しているユーザーはすでに体験されたと思いますが、ついに日本でもAdvanced Voice Modeが利用可能になりました。僕も試してみたのですが、従来のテキストベースの会話とは異なり、自然な対話でほぼ人間と話しているかのような高度な会話でした。 感情をこめた発言や笑い声などが、より人間らしい対話を実現しています。ちなみに大阪弁で会話をしてくれるように命令をしたらしっかり大阪弁になっていました […]