2026年4月17日金曜日

霧尾ファンクラブ

原作全く分かりませんが、テレビアニメであまり気にせず見始めたら一話目からハマってますwまぁ確実に低予算系で、全く期待してなかったアニメが楽しめるというのはうれしい限り。

2026年4月16日木曜日

llama.cpp b8809 [SYCL]のQ8_0のバグ修正

Q8_0って結構好んでるモデルですね…でもQ4とかほかのものもおかしい気が… 

[SYCL] Fix Q8_0 reorder: garbage on 2nd prompt + crash on full VRAM
[SYCL] Fix Q8_0 reorder: add missing dequantize path for GEMM
SYCL: add RAII temp buffer class + macro guard for host fallback
SYCL: document GGML_SYCL_HOST_MEM_FALLBACK build option in SYCL.md
SYCL: add reorder-aware DMMV dequantizers for Q4_K and Q6_K

そもそもこのコード修正すでにAIが行ってるんですか?すごいですね…としか言えない…というかめちゃ怖いw

2026年4月15日水曜日

結構精力的に活動が活発なようですが、今度はturboquantですか…

なんかこちらもホットなllama.cppフォークの様で…kvキャッシュの量子化で小さくすることで高速化するとか。確かに…

cpuのみで動作させてるはずなのに、xpu-smiが表示される。

htopでcpuとメモリーの監視を行いながら、動作確認を行っているとなぜかxpu-msiというプロセスが動いていることに気づきました。

2026年4月14日火曜日

MedGemma1.5が日本語で推論しはじめた!?

しまい込む前にモデルの設定ファイル(.yaml)のF16: falseにしたり効果はないもののreasoning: disable: true にして、ちょっと真面目に?聞いてみました。