qwen3.5-9b、4b、2b、0.8b 測試

今天繼續測試Qwen3.5釋出的9B、4B、2B、0.8B模型，這次釋出的這幾個模型都是多模態的，支援文字與圖片、附件輸入。

測試的環境

Win11 + i5-13600 + 64GB記憶體

Lm studio

RTX5060ti 16GB

測試下來，qwen3.5 9B Q4 在RTX5060ti 16GB，只能跑出54~58 token/s的成績。

大下文長度設為17900，顯存約吃掉8GB，設為241354，顯存吃掉15.4GB，上下文全開262144的話，顯存會超過16GB，速度會明顯下降。

簡易的數學問題，回答正確，但有時它會先說10.15大，然後最後又自證10.4大。

進行文章翻譯

進行圖片分析

4B可以在上下文全開262144的情況下，跑出78~80token/s的成績，圖片分析、跟9B測試的數學問題、文章翻譯，基本上4B都能做到。

用同一張圖進行圖片分析，4B給出的回應跟9B不太一樣，比較像是根據圖片來回應你的問題，9B則是只進行圖片分析。

2B可以在上下文全開262144的情況下，跑出150~154token/s的成績，圖片分析、跟9B測試的數學問題、文章翻譯，基本上2B都能做到。

2B模型就沒有思考功能了。

但問10.4 跟 10.15 哪個大，它一樣會有先說10.15大又自證10.4大。

圖片分析

0.8B可以在上下文全開262144的情況下，跑出188token/s的成績，圖片分析、跟9B測試的數學問題、文章翻譯，基本上0.8B都能做到。

跟2B模型一樣沒有思考功能。

圖片分析

個人是覺得翻譯品質相較之前幾個模型，略過於簡潔。但假如是用來翻譯句子之類的，不是翻譯文章，0.8B似乎也行。

數學問題

老實說9B的速度反而低於我的預期，畢竟Qwen3.5 35B-A3B Q2 都能跑到50~70多了，9B速度也就差不多而已。但表現還是可以的。

反倒是0.8B、2B、4B，覺得更令我驚豔，尤其是0.8B、2B這兩個模型，以前其他這等級的模型基本上都會亂回答、不可控，但這次這兩個模型居然還不錯。現在真的小模型也能實現日常簡易用途了，當然還是沒法跟線上大模型比，例如上傳幾十MB的PDF要做分析，直接就報錯了，上下文太小。

至於這幾個模型的寫code能力，改天再測試了。(簡單測試了一下，9B模型也沒法正確寫出一個HTML數獨遊戲)

💖 支持作者： 如果我的內容對你有幫助，歡迎請我喝杯咖啡 ☕，您的支持是我持續創作的最大動力！點我贊助

文章轉載或引用，請先告知並保留原文出處與連結！！(單純分享或非營利的只需保留原文出處，不用告知)

原文連結:
https://blog.aidec.tw/post/qwen35-test

若有業務合作需求，可寫信至： [email protected]

創業、網站經營相關內容未來將發布在小易創業筆記

相關文章