qwen3.5-35b-a3b 測試(使用rtx5060ti)

Qwen系列的模型我都蠻喜歡的，尤其qwen3系列後，所以這次推出qwen3.5我也很期待，尤其最期待的就是qwen3.5-35b-a3b跟qwen3.5 9b了，目前9b的還沒看到推出，之後有推出再來測試看看。為何會期待這兩個模型呢?那當然是這兩模型最適合我這初階消費級顯卡本地部屬了。畢竟本地部屬不太可能跑得動那種幾百B的模型。

測試了一下，RTX5060Ti 16GB顯存，跑qwen3.5-35b-a3b 這個模型Q4等級的基本上能跑，但實在太慢了，反覆測試調整參數，也只能跑出14token/s的成績，基本上沒有35 token/s，我都認為是不可用的。

目前測試下來，大概最適合的是Q2等級的模型，目前是使用 Manojb/Qwen3.5-35B-A3B-UD-Q2_K_XL.gguf 這個模型。

可以跑出 53.65~75.98 token/s 的成績，這成績是可以接受的，回應的品質我也覺得還行，寫code的能力就一般般，反正叫他寫個數獨得到的結果蠻破的，但基本上同等級的模型沒一個能跑出來正常數獨遊戲的，都有各種bug，有些甚至連數獨是甚麼都理解錯誤，就別太要求了。

整理資料、寫文章、數學問題都還行(10.4 大還是10.15大，它有回答正確)，就是有時思考時間過長了，lm studio除了官方提供的model，都沒地方可以設定如何關閉思考。

參數設定

實測影片

<div class="col-xs-12 col-lg-12 "><div class="inpost-gads"> <div class="ad-container"> <ins class="rwd_inpost_ads gad_responsive_1 adsbygoogle " style="display:block; text-align:center;" data-ad-layout="in-article" data-full-width-responsive="true" data-ad-format="fluid" data-ad-client="ca-pub-8951183611481262" data-ad-slot="2926794282"></ins> </div> </div></div><script> (adsbygoogle = window.adsbygoogle || []).push({}); </script>

💖 支持作者： 如果我的內容對你有幫助，歡迎請我喝杯咖啡 ☕，您的支持是我持續創作的最大動力！點我贊助

文章轉載或引用，請先告知並保留原文出處與連結！！(單純分享或非營利的只需保留原文出處，不用告知)

原文連結:
https://blog.aidec.tw/post/qwen35b-a3b-test

若有業務合作需求，可寫信至： [email protected]

創業、網站經營相關內容未來將發布在小易創業筆記

相關文章