2026年4月21日火曜日

気づいたら、そのうちピカソの絵を超える絵ができるかもしれない。

その昔、サルがキーボードを適当にたたいて、シェイクスピアができる確率とかなんとかありましたが、まさにそのサルに自分がなっているかのような気分になっています。

何か?と言えば、生成画像ですね…確かに結構面白ですね。制限等はあるものの何も考えずにWebUIのボタンを押して放置すれば絵ができるんですから…

どうもいままでdreamshaperプロンプトは全く無視されていたという事が分かりました…sd3.5_mediumとなっているstablediffusionだと、プロンプトが正しく通っていて、fishとしたものもちゃんとそれっぽいのが出てきてくれました。

子供のころ見た恐竜図鑑に出てくるような魚類っぽいものですが…まぁ4文字でこれを作ってくれるのはすごいですよね…検索して拾った方が早そうですがw

で、このモデルって新しいのか古いのか良く分かりませんが、中を見るとQ4_0となっているので結構な量子化バージョンです。しかも結構実行時のメモリを食うようで…プロンプトの内容によって落ちる感じですね…CPUのみで動かして512x512で30~40分かかるわけですが、大きくすると体感としては比例して時間がかかる感じでしょうか。768x768だと90分とか?1024x1024だと2時間とか3時間とか?そんな感じでした。おそらくプロンプトにもよると思いますが。

で、この肝心のプロンプト。どうしたらいいのか?という事で、2chとか5chのまとめサイトでAIチャットで「プロンプトを作ってもらって」とか言ってたので、それを試してみました。Gemma4に…w

するとめちゃくちゃ手馴れているのか?すごい勢いで教えてくれました。まるでgemini見たいと思えるほどに…。おそらくそういう使われ方を前提としているんでしょうね…ただのチャット相手として使って試している人って結構稀なんですね…実感しましたよ…

日本語で、「~」というようなときはプロンプトはどうすればいいですか?ってモデル名もつけて問いかけると、見事に(おそらく知ったかぶりはされていると思うものの)まともそうなプロンプトの提案を複数上げてきて、さらにはそれらのオプション的な「このことばをこう変えるといいかもね!」とかまで(正直余計なお世話レベルですがw)教えてくれます。

で、一番最初に聞いたときに漠然として聞いたので、こういうプロンプトだとこうなりますよー的なサンプルをいただいたので、そのサンプルから作成した画像がこちら…


 
ぶっちゃけ、このモデルかなり古い感じで、人間の手や足の細かいところがかなりダメです。Q4_0というのが効いているからかもしれませんが。あとパラメータサイズもそこまで大きくないので。

ネガティブプロンプトを指定し忘れたか、指示が無かったのでちょっと違ってる感じもしますが、結構いい感じの絵を作ってくれるという事が分かりました。

ちなみに、dreamshaperはそれらしい絵が出てきた時もあったのでプロンプトがダメなのかと思ったんですが、fishと入力して

よくわからないサーバーラックのような、変圧器とかなにかの装置のような画像が出てきて、「あ、これ指示なしだととりあえずなんかの絵を出してくるだけだな?」と思うようになりました。 

0 件のコメント:

コメントを投稿