公開もしていない記事がいくつもあったりしますが、久しぶりにまともに書けそうです。
2026年6月20日土曜日
2026年6月13日土曜日
途中経過
七転八倒しながら結構いい感触を得られています。
原因不明のエラーの調査は進めていないので512x512レベル止まりですが、cpyロジックも手を加えた結果、
vae 24.13s 全体では 322.93s(テキストエンコードはCPU)となりました。
手元のテキストの過去の記録を見てみると…vaeのベストと比べると誤差レベルで遅くなっていますが、全体では20s程度短くなっています。
GGML的にはdup(複製)の中のcpyロジックのf16->f32とf32->f16部分のみ。モデルファイルがQ4_K_M、Q8_0、safetensorsファイルを使っているのでこの辺の変換にも手を加えるともっと実行速度が短くなりそうです。
あと、実際のログを見て効果の高そうな処理から手を加えた方が効果的かなとも。
cpyのロジックを見る限り、正当に処理を実装しているのでとても無駄が多い実装になっています。どうしても計算量を減らそうとするとそのままではあまり効果が出ないので、実データをを踏まえて実装しなおしています。そのため、結構限定的な実装になってはいます。
当面の目標としては512x512で1分ぐらいで出来上がると嬉しいかなぁ…とか思いながら遊んでいますが、vaeベースを考えると 24秒×5=120秒程度ぐらいには行けるのかな?とは感じていますが…メモリ的にテキストエンコードがCPUのままにしているのでこれよりは遅くなりそうかな?
そういえばLocalAIのバージョンアップも行われていますね…SYCLが楽しすぎて全然触れていませんが(笑)
2026年6月9日火曜日
SYCL ワークサブグループが熱い!?
さっきまでワークサブグループってなんかの単位何だろうな…とあまり意識していませんでした。この感動をどう伝えたらいいのだろうか…。今風の書き方ならまず結果を書くべきなのかな?
2026年6月8日月曜日
2026年6月7日日曜日
キメラ合成
実行時間
外付けHDD
2026年6月4日木曜日
ふむ…
先日から牛歩です(笑)
結構根本的に色々と蹴躓いているので、例のフラグ(-fno-sycl-id-queries-fit-in-int)をどこにセットすればコンパイルに反映してもらえるか少し試してみました。
2026年6月3日水曜日
2026年6月2日火曜日
なんとなくソースが怪しいので
2026年6月1日月曜日
Flux.2 klein で vae 変換時に ggml 内でエラー
今までもろもろの条件により、vaeもcpuで実行していたのですが、--diffusion-fa指定しなきゃ出力できないなら、vaeもgpuでいいんじゃね?的なことを感じたのでちょっと試したところ、256x256では出力できました。
毎度いつもの…w
Flux.2 kleinが出力できた記念として…いつもの行きますw
プロンプト「fish」
背景が真っ白になってしまうのはこれが魚に見えるだろうという自信の表れなのか、背景が無指定の場合のデフォルトが白色で設定されているからなのかは謎ですが、Qwen Image 2512もこんな感じだったので流行なのでしょうか?ただ、明らかに本当に存在してそうな雰囲気です。でも寂しいのでもう一枚。プロンプト「fish at deep sea.」
Flux.2のtext encodeがqwen 3の8Bとかだったので日本語でもやってみました。(3.6ベースだったら安心して日本語でもいけそうですが、3だとちょっと怪しくなりそうです)
プロンプト「魚」
プロンプト「深海にいる魚」ほぼ同一の画像が生成されました。相違点はプロンプトの処理で乱数がずれたのでしょう。
日本語の理解力にかかってきますが、慣れ親しんだ言葉で通じるのは楽ですね。ただ、きちんとした指示を出すことを考えると、英語の方が端的に表現できるので、ケースバイケースかな?あ、でも、gemmaとかにプロンプトを考えてもらえなくてもプロンプトがザックリ作れるから楽にはなるのかな?



