2026年6月2日火曜日

なんとなくソースが怪しいので

CUDAの方のソースも見てみました。

現時点のソースを見ると、カーネル内のプログラムはブロックのX、Yの動きができていますが、SYCLの方ではxのみ。無論、呼び出し元の形も一次元のみのブロック展開対応となっています(しかも実装が中途半端感が非常に強い)

なんとなくですが、単純に猿真似するだけでFlux.2のvaeがちゃんと動いてくれそうな気がしてきました…
寝る前にちょっと試してみようかな…

0 件のコメント:

コメントを投稿