ふと、シンプルなプロンプトで生成した画像がgoogle画像検索で引っかかるかもしれないと思い立ち、QwenImageで生成した画像を画像検索してみました。
昔は人の顔で検索ができたので結構楽しかった記憶がありますが、現在ではほぼ無効化されていて、著名人の中でも誰でも知っているレベルでなければなかなか検索してもらえなくなってしまいました。正直なところ一般人の特定はやりすぎですが、せめて表舞台に出ている人ぐらいは検索で名前を知りたかったりします。
メモやら記録やら
ふと、シンプルなプロンプトで生成した画像がgoogle画像検索で引っかかるかもしれないと思い立ち、QwenImageで生成した画像を画像検索してみました。
昔は人の顔で検索ができたので結構楽しかった記憶がありますが、現在ではほぼ無効化されていて、著名人の中でも誰でも知っているレベルでなければなかなか検索してもらえなくなってしまいました。正直なところ一般人の特定はやりすぎですが、せめて表舞台に出ている人ぐらいは検索で名前を知りたかったりします。
最近気になるのが位置情報取得でタスクバーにチラつく位置情報取得のアイコン
ブラウザの位置情報取得はある程度は理解できるが、何も使用していなくても、ディスプレイ消灯→復帰時や、スリープ→スリープ解除時などにチラつくので非常に目につく。というか、このようなタイミングで無駄に処理負荷がかかるのは正直とても好きじゃない。
とてつもなく不毛なことを実行している気分ですw量子化 Q3とかQ2とか使っているのにとても時間がかかっております(笑)
昨日は真っ白画像と格闘しつつ、安定して出力できていますが、量子化の劣化によるものか、QwenImageの特性なのか、思った以上にプロンプトの指示が通りません。中国語じゃないとダメなのかな?
Visual Studio 2022は既にインストール済みなので、Windowsネイティブでllama.cppを動かすのは簡単だと思っていたのですが…結構大変そうですw
llama.cppのdocs/build.mdを読んでいていまさらながらに気づいたことが…
Intel oneMKL
Building through oneAPI compilers will make avx_vnni instruction set available for intel processors that do not support avx512 and avx512_vnni. Please note that this build config does not support Intel GPU. For Intel GPU support, please refer to llama.cpp for SYCL.
インテル oneMKL
oneAPIコンパイラを介して構築することで、avx512およびavx512_vnniをサポートしていないIntelプロセッサ向けにavx_vnniの命令セットが利用可能になります。このビルド構成はIntel GPUをサポートしていません。Intel GPU のサポートについては、SYCL 版 llama.cpp をご参照ください。
??もしかしてavx2ではなくてavx512も動かせるっていう事??
こ、これはぜひ試してみたいものです。これができるなら消費電力や発熱問題は出てきそうですが、チャットのレスポンスが上がるかも?
生成AIとチャットで遊ぶために、遊び用のやっすいミニpcを用意する。
環境を整える。
環境が整ってどんな感じかわかってくる。
どんな感じかわかってきたのでチャット以外も手を出す。
やっすいミニPCなので画像生成だけでも作業を行うと他のモデルすら動かせずプロンプト作成に別のモデルを使うことができない。
軽いモデルでいいからいつも使ってるやっすいネットブックで動かそうとする。(←今ここ)
という経緯となっていますが、最初からそれ用のPC用意すればよかったんじゃね?的な(笑)