2026年6月1日月曜日

Flux.2 klein で vae 変換時に ggml 内でエラー

今までもろもろの条件により、vaeもcpuで実行していたのですが、--diffusion-fa指定しなきゃ出力できないなら、vaeもgpuでいいんじゃね?的なことを感じたのでちょっと試したところ、256x256では出力できました。

昔の生成画像で人物の指の数がおかしくなる原因

常識なのかもしれませんが、あらためて実感したことです。

毎度いつもの…w

Flux.2 kleinが出力できた記念として…いつもの行きますw

プロンプト「fish」

背景が真っ白になってしまうのはこれが魚に見えるだろうという自信の表れなのか、背景が無指定の場合のデフォルトが白色で設定されているからなのかは謎ですが、Qwen Image 2512もこんな感じだったので流行なのでしょうか?ただ、明らかに本当に存在してそうな雰囲気です。でも寂しいのでもう一枚。

プロンプト「fish at deep sea.」
 

結構かっこいい感じの絵が出てきました。英語は苦手なので定冠詞が無いだとかinだとか言わないでもらえると助かります(笑)。

Flux.2のtext encodeがqwen 3の8Bとかだったので日本語でもやってみました。(3.6ベースだったら安心して日本語でもいけそうですが、3だとちょっと怪しくなりそうです)

プロンプト「魚」

プロンプト「深海にいる魚」
ほぼ同一の画像が生成されました。相違点はプロンプトの処理で乱数がずれたのでしょう。

日本語の理解力にかかってきますが、慣れ親しんだ言葉で通じるのは楽ですね。ただ、きちんとした指示を出すことを考えると、英語の方が端的に表現できるので、ケースバイケースかな?あ、でも、gemmaとかにプロンプトを考えてもらえなくてもプロンプトがザックリ作れるから楽にはなるのかな?