2026年6月1日月曜日

昔の生成画像で人物の指の数がおかしくなる原因

常識なのかもしれませんが、あらためて実感したことです。

一般的な生成画像が一般化した当初は、人物の手の指の数が多くなってしまう事が多かったのですが、これはおそらく画像の平均値を取ろうとするときに複数の画像イメージを重ね合わせるときにそのままの形を重ね合わせて平均値を取ろうとするという手法によって、結果的に指の数が多くなってしまう事になったのだと思います。

最近発表されているものは、この辺の処理がおかしくならないように処理を変えるようになったのだと思います。

幾つか手法が考えられます。

・平均値をとりつつも、元となる画像を一本化し、その画像を変形させることで形作るようにする。

・平均値をとったうえで物の形を考慮して不整合部分を消去する。

・初めから物体の平均値画像を用意し、その画像を変形させながら形作る。

 他にもたぶんやり方は色々あると思います。最後の物が処理が一番軽くなりそうですが、表現の範囲が狭まってきそうですね。

おそらく最近の生成画像はこの辺の処理を行うようになっているのだと思います。もしくは「調整」で結構変わっている部分も多いので、3つ目の「物体の平均となる形」を持っていると考えることもできます。特にFluxの小ステップで完成できるものはこれ以外に考えられない気もします。

0 件のコメント:

コメントを投稿