現時点のソースを見ると、カーネル内のプログラムはブロックのX、Yの動きができていますが、SYCLの方ではxのみ。無論、呼び出し元の形も一次元のみのブロック展開対応となっています(しかも実装が中途半端感が非常に強い)
なんとなくですが、単純に猿真似するだけでFlux.2のvaeがちゃんと動いてくれそうな気がしてきました…
寝る前にちょっと試してみようかな…
メモやら記録やら
今までもろもろの条件により、vaeもcpuで実行していたのですが、--diffusion-fa指定しなきゃ出力できないなら、vaeもgpuでいいんじゃね?的なことを感じたのでちょっと試したところ、256x256では出力できました。
Flux.2 kleinが出力できた記念として…いつもの行きますw
プロンプト「fish」
背景が真っ白になってしまうのはこれが魚に見えるだろうという自信の表れなのか、背景が無指定の場合のデフォルトが白色で設定されているからなのかは謎ですが、Qwen Image 2512もこんな感じだったので流行なのでしょうか?ただ、明らかに本当に存在してそうな雰囲気です。でも寂しいのでもう一枚。プロンプト「fish at deep sea.」
Flux.2のtext encodeがqwen 3の8Bとかだったので日本語でもやってみました。(3.6ベースだったら安心して日本語でもいけそうですが、3だとちょっと怪しくなりそうです)
プロンプト「魚」
プロンプト「深海にいる魚」日本語の理解力にかかってきますが、慣れ親しんだ言葉で通じるのは楽ですね。ただ、きちんとした指示を出すことを考えると、英語の方が端的に表現できるので、ケースバイケースかな?あ、でも、gemmaとかにプロンプトを考えてもらえなくてもプロンプトがザックリ作れるから楽にはなるのかな?