qwen3.6-35b-a3b RTX5060ti 16G適合的參數

qwen3.6-35b-a3b，目前測試起來最推薦HauhauCS的IQ3_M版本。

RTX5060ti 16G，可以上下文65K，GPU註冊32

LM studio 下可以跑出每秒35token/s，Gemma4的話就得犧牲上下文來跑高速。

且能製作出HTML數獨遊戲，之前的測試裡，同級模型基本上沒一個能正確做出數獨遊戲的

速度上跟智力上維持一個平衡狀態。每秒35token/s算是我可以接受的最低值了，低於這個值我都認為速度不OK。

假如是Q2版本能達到65token/s左右，但是智力就明顯下降了，但也不是到完全不可用的階段，只是要是沒有智力加持的話，相較之下，我寧願用Qwen3.5 9B或4B。

晚點來測試看看IQ4版本的，看智力會不會在更提升，且速度能到甚麼等級。

IQ4的體驗起來，品質差異不大，只略提高一些。速度下降到26token/s左右。

是說現在這些模型，16GB根本都不太夠用。老黃也不出個24G或中價位的32GB顯卡。只有5090才有32GB，實在太爛了~

💖 支持作者： 如果我的內容對你有幫助，歡迎請我喝杯咖啡 ☕，您的支持是我持續創作的最大動力！點我贊助

文章轉載或引用，請先告知並保留原文出處與連結！！(單純分享或非營利的只需保留原文出處，不用告知)

原文連結:
https://blog.aidec.tw/post/qwen3.6-35b-a3b

若有業務合作需求，可寫信至： [email protected]

創業、網站經營相關內容未來將發布在小易創業筆記

相關文章