出力が気になったので、Qwen Image 2512ではなく、もともとのQwen Imageを試しています。
大まかな感触としては同様に使用できそうですが、やはり調整が整っているバージョンは全体的な整合性がきちんととれていますね。
特に背景部分は量子化されて劣化していていても、2512ではあまり違和感を感じることはあまりありませんでしたが、初期バージョンのものは明らかに違和感を感じることが多かったです。例えば背景が電車の駅のプラットフォームだった(本当は駅前とかそんな感じのつもりだったのですがw)ときがあったのですが、何故か線路があるべき場所にブロックが敷き詰められて描かれてしまいました。
2512のモデルカードにも大々的に「より自然な」という謳い文句がありますが、人物の顔のベースが違っているのを感じました。どちらが好きかと言う部分もありますが、もともとのモデルの方が「AI顔」っぽいイメージで描かれることが多かったです。
全体的に明らかに違っているのが、肌の描画方法が2512ではディザリングされたような感じでレンダリングされているのですが、素のQwen Imadeでは綺麗なグラデーションがかかった感じで描画されています。どちらが自然かと言えば、個人的にはディザリングよりも綺麗なグラデーションベースの方が自然のような気がしますが、肌の質感を出すためにはある程度ディザリングを使った方がざらざら感が出るので自然な感じに感じるかもしれません。ただ、2512は極端にディザリングを使用しているので、拡大させると逆に不自然なのですが(笑)
まぁ細かいところで違っていて比べるのはとても面白かったです。2512の一つ前のバージョンもあるようなのでそれとも比べてみたいなぁ…
そういえばstable-diffusion.cppのアップデートでflux.2のvaeの対応が行われたみたいなので、もしかするとそっちも試せるのかな?
0 件のコメント:
コメントを投稿