今天繼續測試Qwen3.5釋出的9B、4B、2B、0.8B模型,這次釋出的這幾個模型都是多模態的,支援文字與圖片、附件輸入。
測試的環境
Win11 + i5-13600 + 64GB記憶體
Lm studio
RTX5060ti 16GB
測試Qwen3.5 9B Q4
測試下來,qwen3.5 9B Q4 在RTX5060ti 16GB,只能跑出54~58 token/s的成績。
大下文長度設為17900,顯存約吃掉8GB,設為241354,顯存吃掉15.4GB,上下文全開262144的話,顯存會超過16GB,速度會明顯下降。
簡易的數學問題,回答正確,但有時它會先說10.15大,然後最後又自證10.4大。
進行文章翻譯

進行圖片分析

測試Qwen3.5 4B Q4
4B可以在上下文全開262144的情況下,跑出78~80token/s的成績,圖片分析、跟9B測試的數學問題、文章翻譯,基本上4B都能做到。
用同一張圖進行圖片分析,4B給出的回應跟9B不太一樣,比較像是根據圖片來回應你的問題,9B則是只進行圖片分析。

測試Qwen3.5 2B Q4
2B可以在上下文全開262144的情況下,跑出150~154token/s的成績,圖片分析、跟9B測試的數學問題、文章翻譯,基本上2B都能做到。
2B模型就沒有思考功能了。
但問10.4 跟 10.15 哪個大,它一樣會有先說10.15大又自證10.4大。

圖片分析


測試Qwen3.5 0.8B Q8
0.8B可以在上下文全開262144的情況下,跑出188token/s的成績,圖片分析、跟9B測試的數學問題、文章翻譯,基本上0.8B都能做到。
跟2B模型一樣沒有思考功能。
圖片分析

文章翻譯
個人是覺得翻譯品質相較之前幾個模型,略過於簡潔。但假如是用來翻譯句子之類的,不是翻譯文章,0.8B似乎也行。


數學問題
老實說9B的速度反而低於我的預期,畢竟Qwen3.5 35B-A3B Q2 都能跑到50~70多了,9B速度也就差不多而已。但表現還是可以的。
反倒是0.8B、2B、4B,覺得更令我驚豔,尤其是0.8B、2B這兩個模型,以前其他這等級的模型基本上都會亂回答、不可控,但這次這兩個模型居然還不錯。現在真的小模型也能實現日常簡易用途了,當然還是沒法跟線上大模型比,例如上傳幾十MB的PDF要做分析,直接就報錯了,上下文太小。
至於這幾個模型的寫code能力,改天再測試了。(簡單測試了一下,9B模型也沒法正確寫出一個HTML數獨遊戲)
文章轉載或引用,請先告知並保留原文出處與連結!!(單純分享或非營利的只需保留原文出處,不用告知)
原文連結:
https://blog.aidec.tw/post/qwen35-test
若有業務合作需求,可寫信至: [email protected]
創業、網站經營相關內容未來將發布在 小易創業筆記