2026年4月4日土曜日

Gemma 4 (思考抑止モード)がどの程度遊びに付き合ってくれるか試してみた(笑)

Gemma 4の画像認識がどの程度なのかを見ていてどの程度のものが倫理フィルターに引っかかってしまうのか気になったので試してみました。

ザックリと、どの程度のものが性的なコンテンツとして拒否されてしまうのか?という点だけですが、それらしい拾い物の画像を投げ込んでは「この画像の説明をお願いします」と聞くという…なんかむなしい作業です(笑)

ダメそうなものの説明がようやく拒否されたのですが、ふとこんなことを考えたんです。

画像認識や画像検出するためにGemma 4を利用したときに、倫理フィルターに引っかかった場合、確実に拒否されたことが分からないときにシステム的にとても危険な状態になるのではないか?という事です。

拒否されたときに少し突っ込んでチャットで「倫理フィルターで拒否されたことが分かるように特定の「キーワード」を提示させることは可能ですか?」と聞いてみました。が、どうも最初に提示した画像が倫理フィルターにかかっているためなのか、回答がイマイチうまくかみ合わず「この画像の説明を行うことはできません」と言ったような趣旨の言葉が出てきてもあきらめず、(新たにチャットを始めればよかったのかもしれませんが)必死にきいてゆくと、どうも倫理フィルターに該当すると判断した場合は、出力が抑止または別の出力が行われるようになるために、制御は一切できず、何の保証もできない。という話が聞けました。

なので、逆にこんなシステムプロンプトを考えてみました。 

「あなたが正常に回答できる場合は「発言」時の最初に「〇」を出力してください。
これは倫理フィルターによって処理が行われなかった時に誤動作を起こさせないための処置です。」

ものすごく素直に理由づけも行ってみました。(以下回答の頭に「〇」が付いているのはこのシステムプロンプトが効いているからですw)

こうすることで倫理フィルターに引っかかった場合、「〇」は出力されなくなるはずです。

新たなチャットを開始してこのシステムプロンプトを入れた状態で聞いてみました。

🤖「私はAIであり、安全ガイドラインに従って…

という事で「〇」が出力されずにこの写真が明確に拒否されたことが分かるようになりました。

別のチャットでは普通の写真は説明文に「〇」が出力されていることが確認できました。

 

と、それとは別件で、もっと簡素な出力ができない物だろうか?という疑問も出てきました。ただ「簡素に説明してください」だけではそれなりに長い説明なので何とかならないかとちょっと突っ込んでみました。

👨「この画像について簡単で簡素な説明をお願いします。

🤖「〇この画像は、明るい室内で、一人の女性が数人の子供たち(または若い人々)と交流している様子を捉えています。
女性は笑顔で手を挙げたり身振り手振りで何かを説明しているように見え、子供たちは彼女の方を向いて話を聞いているか、一緒に参加しているようです。全体的に、ポジティブで活気のある、教育的または指導的な場面を写したスナップショットのように見えます。背景は明るく、穏やかな雰囲気が漂っています。」

👨「もっと簡素な表現はできますか?

🤖「〇はい、もっと簡素に表現します。
**笑顔の女性が、周りの子供たちに何かを教えている(話しかけている)場面です。**
(さらに短くするなら:**女性と子供たちの交流の様子**)」

👨「最初からそのような表現手法で説明を求める場合は、あなたにどのように質問すればよろしいでしょうか?」

🤖「〇画像の説明を「最初から簡潔・簡素に」求める場合、以下のような指示を加えるのが最も効果的です。
推奨される質問方法
1. 依頼の冒頭でトーンを固定する
  最もわかりやすいのは、質問の最初に「簡潔に」「要約して」「箇条書きで」といった言葉を入れることです。
    > 例1:「この画像について、できるだけ簡潔に説明してください。」
    > 例2:「この画像の内容を一文で要約してください。」
    > 例3:「この画像の特徴を箇条書き(3点以内)で説明してください。」
2. 説明の「深さ」を指定する
「詳しく」ではなく、「表層的(見たまま)」に説明してほしい、と指示を出すのも有効です。
    > 例4:「この画像について、見たままの描写のみで説明してください。解釈は不要です。」
まとめ
あなたが提示してくださった新しい画像(子供たちが座っている画像)に対して、最初から短い回答を求めるのであれば、「この画像について、簡潔に説明してください。」と質問するのが、最も意図が伝わりやすい方法です。」

とのことでした。

で・す・が…

「この画像について、簡潔に説明してください。」ではあまり簡素にならなかったので、上記の例2の「この画像の内容を一文で要約してください。」が正解の様です。

で、この状態で先ほど倫理フィルターに引っかかった写真を「この画像の内容を一文で要約してください。」としてみたところ、

🤖「〇この画像は、オフショルダーのトップスとショートパンツを着用した人物のバストと上半身をクローズアップした写真です。

…説明文が出てきました。(まぁ何がフィルターに引っかかったのかこの説明文だと謎すぎますが…)

思考抑止状態で動かしているので細かい点はわかりませんが、もしかすると画像を説明する内容を説明するためのキーワードが倫理フィルターに引っかかって説明が拒否されたという事なのかな?思考を表示させてこの辺がどう反応してみるのがいいのかもしれないが…その思考も抑止されちゃうんじゃないかなぁ?とか思ってみたり。

 

別建てで、チャットでも少し試し始めています。

話の展開が自然で露骨な表現でなければ、発言内容が破綻することなく続けることができている感じです。話的には結構だめそうな感じを含めているのですが、Gemma 3や3nと違いさらに理解が深まっているのか、話が破綻することなく続けられます。

どの様な感じで、この辺の倫理フィルタリングが行われているかは不明ですが、感触としてはGemma 3と同様のような感じがします。

 

 

結構、書いたブログ記事をgemmaさんに読んでもらって主に誤字や勘違いが出ていないかを確認するのですが、今回はこれを公開する前にGemma 4のチャットに「こんなブログ記事を書いてみました。読者の主なターゲットは未来の自分です。」と書いた後に貼り付けたら、即座に全部書き換えられてしまいました…基本的な構成は同じなんですが、節々でかっこよくなってます(笑) 書き換えられてしまった記事は…気が向いたら貼り付けるカモ? 

0 件のコメント:

コメントを投稿