naruBBS


[記事リスト] [返信する] [新着記事] [ワード検索] [留意事項] [管理用]

タイトル 画像生成AIの進化が恐ろしい。
投稿日 : 2025/09/04(Thu) 14:43:09
投稿者 管理人
参照先
LLMの進化が今年5〜6月頃から急加速していないか?
GPT-5が凄いとか、沢山のyoutube動画でも上がっていたけれど、画像生成の進化がそれにも増して凄いことになっている。Googleのバナナが現在一番らしいが、中国系AIもCopilotも、Grokもあまり取り上げられてはいないけれど知らないうちに進化していてビックリしているところ。

画像生成の今のところの弱点は、画像内の文字(日本語)が雰囲気文字で実際出来上がったものが読めないなどあり、英語や中国語が完璧になってきているけれど、事、日本語に関してはまだまだだというところ。

あとは画像の統一性というところで、これもnano-bananaなるGoogleの画像生成が頭一つ抜き出ている。

CopilotはマイクロソフトのLLMだけど、去年使ってみて、他のものより劣っているというイメージしかなかったけれど、同じキャラクターで生成できることを知って正直驚いている。
今までは、生成できた画像について、再度「この女性を笑わせて」というお願いには全く別人、全く違う衣装、で作られてしまっていたが、同じ人物に笑わせることが出来た。単なる「笑わせて」というコマンドでは途中まで作成したあと、「出来ません」と断られてしまったが、再度プロンプトを作成して「同じ人物で〜新しいプロンプト」で実行したところ出来てしまった。
まだbananaよりも自由度はなく操作性も悪いけれど、進化は実感できた。

また、Grokも画像生成に力を入れているのを実感できたのが、本日確認できた。プロンプトを入力したら、そのプロンプトだけで無限に画像が作られるのだ。少しづつ違う状態の画像が何枚も作られて、そのうちの一枚を選ぶとまたその方向に向く画像が作られていく。フリープランでは20枚くらいしかDL出来なかったが、画像から動画生成もできるのを確認したので、また後日試してみようと思う。もしかしたらテスト段階だけなのかもしれないけれど、これは面白い仕組みだと感じた。

- 関連一覧ツリー (▼ をクリックするとツリーを一括表示します)


- 返信フォーム (この記事に返信する場合は下記フォームから投稿して下さい)
おなまえ
Eメール
タイトル
メッセージ
参照先
暗証キー (英数字で8文字以内)
投稿キー (右画像の数字を入力) 投稿キー

  プレビュー

- 以下のフォームから自分の投稿記事を修正・削除することができます -
処理 記事No 暗証キー

- WebForum -