mulでも…と思って手を加えようと思いながらも…どこからどうやって動いているのかさっぱりわがんねw/(^o^)\
とりあえず見かけている命令を…となんかそのままのcppを見てみました。
とりあえず…norm…どんな処理何でしょうかね?
基本中の基本そうなnorm_f32_syclにデバッグログを仕掛けて動かして、実際にココが動いているのを確認。
ここまではまぁ順調。で、かなり怪しいコンバートコメント…。
そして、今までSYCLで見かけていた言葉が出てきました。メモリーフェンスとか…全体的にちゃんとした作りになってそうですが、ncolが1024以上で分岐があったり、節々にやっつけ感が…w
で、GPU内で動かすロジックに結構for分やら何やらが…こりゃぁ重いだろうな…とか思いながら中身を見ていきましたが、何やってるんでしょうね?w
サブグループの指定もあるし…まぁそれなりに動くんじゃないでしょうか…としか言えないw
正直適当なsubmitだったらそのsubmitの処理単位を弄ろうと思ってたのですが、簡単そうな?物でもお手上げです…orz
0 件のコメント:
コメントを投稿