サイクルカウンタを使ってみて気になったのはパフォーマンスカウンタを有効にしていると発熱や消費電力に影響があるのかないのか?気にはなりますが、おそらく数字に出てこないレベルなのではないかと思うのですが、とはいえ、使用が終わったらカウンタを止めておきたいと思ったときに、本当に止まっているのかテストをしてたところ、
while((cnt<50000) && (((unsigned long)end - start)<150)){
cnt++;end = pmon_read_cycle_counter();
}
if(isStart){
pmon_stop_cycle_counter();
dummy = pmon_read_cycle_counter();
printf("stop\n");
dummy2 = pmon_read_cycle_counter();
printf("%ld, %ld\n", dummy, dummy2);
}
まぁこんなことをやってみたわけです。
サイクルカウンタのテストプログラムでも、一定の回数を回している上記のループが終わった時のカウンタの値が150なのでたまたまかな?と思っていたんですが、これが上記の物でも150という数字を返してきました。
何がすごいかといえば、ループの終了条件判断の分岐とその後の条件文の分岐を無視して機械語レベルで1サイクルの中でサイクルカウンタが止められているということです。
armの特性として、実行条件が命令と結合しているので条件分岐がハマれば実行順序の乱れが無いというのは分っていたのですが、ここまで正確に数字に出てくると驚きの方が大きかったです。
試しに停止直前に
dummy = pmon_read_cycle_counter();
pmon_stop_cycle_counter();
dummy = pmon_read_cycle_counter();
pmon_stop_cycle_counter();
dummy = pmon_read_cycle_counter();
などと、やってみましたが、これで返される値は151という。
dummyに代入するところは直後に再度同じdummyに代入しているので、最適化で外されているとは思いますが、インラインアセンブラとは言え本当に1cycleしかかかっていないとか…
正直凄い以外の言葉が出ない。
0 件のコメント:
コメントを投稿