2026年6月13日土曜日

笑いが止まらないw

mulでも…と思って手を加えようと思いながらも…どこからどうやって動いているのかさっぱりわがんねw/(^o^)\

とりあえず見かけている命令を…となんかそのままのcppを見てみました。

とりあえず…norm…どんな処理何でしょうかね?

基本中の基本そうなnorm_f32_syclにデバッグログを仕掛けて動かして、実際にココが動いているのを確認。

ここまではまぁ順調。で、かなり怪しいコンバートコメント…。

そして、今までSYCLで見かけていた言葉が出てきました。メモリーフェンスとか…全体的にちゃんとした作りになってそうですが、ncolが1024以上で分岐があったり、節々にやっつけ感が…w

で、GPU内で動かすロジックに結構for分やら何やらが…こりゃぁ重いだろうな…とか思いながら中身を見ていきましたが、何やってるんでしょうね?w

サブグループの指定もあるし…まぁそれなりに動くんじゃないでしょうか…としか言えないw

正直適当なsubmitだったらそのsubmitの処理単位を弄ろうと思ってたのですが、簡単そうな?物でもお手上げです…orz 

0 件のコメント:

コメントを投稿