qwen3.6-35b-a3b,目前測試起來最推薦HauhauCS的IQ3_M版本。
RTX5060ti 16G,可以上下文65K,GPU註冊32
LM studio 下可以跑出每秒35token/s,Gemma4的話就得犧牲上下文來跑高速。

且能製作出HTML數獨遊戲,之前的測試裡,同級模型基本上沒一個能正確做出數獨遊戲的
速度上跟智力上維持一個平衡狀態。每秒35token/s算是我可以接受的最低值了,低於這個值我都認為速度不OK。
假如是Q2版本能達到65token/s左右,但是智力就明顯下降了,但也不是到完全不可用的階段,只是要是沒有智力加持的話,相較之下,我寧願用Qwen3.5 9B或4B。
晚點來測試看看IQ4版本的,看智力會不會在更提升,且速度能到甚麼等級。
IQ4的體驗起來,品質差異不大,只略提高一些。速度下降到26token/s左右。
是說現在這些模型,16GB根本都不太夠用。老黃也不出個24G或中價位的32GB顯卡。只有5090才有32GB,實在太爛了~
文章轉載或引用,請先告知並保留原文出處與連結!!(單純分享或非營利的只需保留原文出處,不用告知)
原文連結:
https://blog.aidec.tw/post/qwen3.6-35b-a3b
若有業務合作需求,可寫信至: [email protected]
創業、網站經營相關內容未來將發布在 小易創業筆記