移動時間は調べ物を別の角度から掘り下げることができるので、結構重要な時間だったりします…大半睡魔との戦いだったりしますけれどw
で3.6ですね。少しバージョンが上がったというようなネーミングですが、いろいろとチューニングが強化されているようですね。コード生成に関しては強化されているようですが。
すっごい先入観なんですけど、Qwenって結構普通なんですよね。gemma3や4が結構人間みたいな反応をしてくれるのが上手くて、そこから比べると、なんか業務的と言うか…冷たい感じ?
道具としてはそっちのほうが良かったりするのであれなんですがw
3.6も3.5と同様のモデルサイズが用意されていて、もデスサイズによってかなり効果的に使い分けることができそうです。
QwenのMoEモデルというのかよくわかりませんが、手元の環境では35B A3Bの量子化されたものが、動作させることが可能な限界サイズだと思います。
gemma4はアクティブ部分が4Bに比べQwenは3Bになっていて、同程度の量子化だと会話のレベルはgemma4の方が話が通じてる印象がつよいです。ただ、全体のパラメータサイズの差もあるのでしょうが、画像認識に関してはgemmaでも刃が立たないほど圧倒的にQwenの方が強力でした。
早速試してみたいですね。
0 件のコメント:
コメントを投稿