何もない知識の中から経験値だけで突き進んでいるわけですが…
Siriuth's Diary
メモやら記録やら
2026年6月2日火曜日
なんとなくソースが怪しいので
CUDAの方のソースも見てみました。
現時点のソースを見ると、カーネル内のプログラムはブロックのX、Yの動きができていますが、SYCLの方ではxのみ。無論、呼び出し元の形も一次元のみのブロック展開対応となっています(しかも実装が中途半端感が非常に強い)
なんとなくですが、単純に猿真似するだけでFlux.2のvaeがちゃんと動いてくれそうな気がしてきました…
寝る前にちょっと試してみようかな…
2026年6月1日月曜日
Flux.2 klein で vae 変換時に ggml 内でエラー
今までもろもろの条件により、vaeもcpuで実行していたのですが、--diffusion-fa指定しなきゃ出力できないなら、vaeもgpuでいいんじゃね?的なことを感じたのでちょっと試したところ、256x256では出力できました。
毎度いつもの…w
Flux.2 kleinが出力できた記念として…いつもの行きますw
プロンプト「fish」
背景が真っ白になってしまうのはこれが魚に見えるだろうという自信の表れなのか、背景が無指定の場合のデフォルトが白色で設定されているからなのかは謎ですが、Qwen Image 2512もこんな感じだったので流行なのでしょうか?ただ、明らかに本当に存在してそうな雰囲気です。でも寂しいのでもう一枚。プロンプト「fish at deep sea.」
Flux.2のtext encodeがqwen 3の8Bとかだったので日本語でもやってみました。(3.6ベースだったら安心して日本語でもいけそうですが、3だとちょっと怪しくなりそうです)
プロンプト「魚」
プロンプト「深海にいる魚」ほぼ同一の画像が生成されました。相違点はプロンプトの処理で乱数がずれたのでしょう。
日本語の理解力にかかってきますが、慣れ親しんだ言葉で通じるのは楽ですね。ただ、きちんとした指示を出すことを考えると、英語の方が端的に表現できるので、ケースバイケースかな?あ、でも、gemmaとかにプロンプトを考えてもらえなくてもプロンプトがザックリ作れるから楽にはなるのかな?
登録:
投稿 (Atom)



