実際に生成AIに直接触れ始めたのは去年のGemma 3ぐらいからですが、どうもパラメータ数を表す単位が大きすぎて想像が全くつかなかったので、身近な(?)数字で感覚的にとらえられないかと考えていました。
そもそもBって何ぞや?と言うところから最初は引っかかるのですがバイトとかではなく、ビリオンという単位らしいのは目にはしていましたが、これが1億なんだか10億なんだか、毎回よく分かってなかったりします。
日本人なら漢数字だと4桁ごとに単位が変わるのですが、これが海外とかだと3桁単位。もちろん英語圏も3桁が一般的。この桁区切りが日本人である私にとって、ギャップをさらに深めています。
日常的にも一、十、百、千、万ぐらいは現金を扱う上で使うので身近なわけですが…電子マネーだとこの辺のボリューム感も掴みづらくなりそうですね…
まぁ億までなら想像はできると思うんですが…で、コンピュータだとキロとかメガとかテラとか。3桁上がると単位が変わっていきますよね。
そもそもビリオンってなんだ?ってことで、似たような音としてはミリオンなら耳にすると思います。で、そのミリオンって何?ってことで…検索してみましょうか(笑)
one millionは百万という事らしいです。(すでにここから単位とボリューム感がまったく一致しないw)
じゃぁビリオンはその3つ上…いっせんまん、いちおく、じゅうおく。なので十億がビリオンってことですかね?
one billionは10億。 覚えるしか無そうw
さて、この10億と言うボリュームが一体どのくらいなんでしょうね?現金でも正直想像つかないボリューム感。昔は3億円といえば3億円事件の3億円と言う感じでしたが、今だと大きなニュースだと1000億円とか。企業の赤字とかだと8000億円とかもう良く分からないことになってますが…。
で、ふと、ここで個人的に扱ってる大きな数字というと…動画の世界に移ります。
(注:あくまでも一般論としてなので厳密な話は突っ込まない方向で(笑))
しかも…個人的に扱っているのはサイズ的にお手頃な720pという単位。こいつは基本的に走査線の数しか表していないのですが、一般的には1024x720ピクセルになっています。
で、このピクセルと言うのもいろいろ厄介な単位ですが…まぁおいておいて、
アニメだと大体1秒間に24枚の絵が切り替わっています。なので24FPS程度。
ざっくり、30分間だとピクセルの総数 1024x720 x 24枚 x 30分間 = 530,841,600ピクセル
(30分アニメは長くても24分ぐらいだろとか、言わないw)
なんかほら、ここで億の数字が出てくるようになりました。で、これが 1時間だと倍なので…
1,061,683,200ピクセルとなり、ようやくここで10億と言う数字になりました。(結構やっつけ状態ですがw)
ここで何となく…1時間ぐらいの動画データが大体1Bと言うボリューム感になりそうという構図が出来上がるわけです。
さて、ここで、実際のファイルサイズを考えてみましょう。動画なんて圧縮されたデータで扱う事ばかりなので一概には言えませんが、今だとほとんど劣化しないような状態を保とうとすると30分ぐらいだと1GBぐらいでしょうか?物にもよりますが、わたしの場合はそんな感じなんですが。
で、60分だとその倍で2GBという感じですね。
生成AIのファイルサイズを見てみましょうかね…
Gemma 4 E2B-it (一応5Bという表記もあります) 10.3GB Q8_0で5.05GB
Gemma 4 E4B-it (こちらは8Bと言う表記あり) 16GB Q8_0で8.19GB
Gemma 4 26B A4B-it (こちらは27B表記あり) 51.6GB Q8_0で26.9GB
(Q8_0はunslothさんの量子化モデルのファイルサイズ)
全く関係ない動画サイズを基準に考えると…
5B = 5時間動画 = 10GB
8B = 8時間動画 = 16GB
27B = 27時間動画 = 54GB
ほぉーら、なんかファイルサイズが一致してるw
なので結構この考え方いけそうな気がする?
0 件のコメント:
コメントを投稿