とてつもなく不毛なことを実行している気分ですw量子化 Q3とかQ2とか使っているのにとても時間がかかっております(笑)
昨日は真っ白画像と格闘しつつ、安定して出力できていますが、量子化の劣化によるものか、QwenImageの特性なのか、思った以上にプロンプトの指示が通りません。中国語じゃないとダメなのかな?
まぁ元がSD3.5向けのテスト用に用意したシンプルなプロンプトと言うのが問題かもしれませんが。
幾つか出力した後、何枚かgemma 4 E4B Q8モデルで生成画像か判断してもらいました。一枚だけ比較としてインターネットで拾った写真も混ぜてみましたが、基本的に全て生成された画像と言う含みを持たせた「写真」と判定。
一方Qwen 3.6 35B A3B Q2では生成した画像はバッサリと生成されたものであるという判定。写真に関しては「高度な生成画像」かもしれないという含みを持たせた写真として判定。
ただ、どちらも人間が撮影した画像に関しては「すべてが完璧ではない」という点で「生成画像ではない」という判定をしているので、その不完全さを再現できた時、画像が生成されたものなのか、現実を写した画像なのかの判定はできなくなることを示していました。
これは動画でも同様だと思うので、現段階で明らかな欠陥が無ければ生成されたものかどうかの判断はつかないという事でしょう。あとは画像にウォーターマークを埋め込むとかそのぐらいしか判別しようがないでしょうね。
0 件のコメント:
コメントを投稿