今天繼續測試Qwen3.5釋出的9B、4B、2B、0.8B模型,這次釋出的這幾個模型都是多模態的,支援文字與圖片、附件輸入。

測試的環境

Win11 + i5-13600 + 64GB記憶體

Lm studio

RTX5060ti 16GB


測試Qwen3.5 9B Q4

測試下來,qwen3.5 9B Q4 在RTX5060ti 16GB,只能跑出54~58 token/s的成績。

大下文長度設為17900,顯存約吃掉8GB,設為241354,顯存吃掉15.4GB,上下文全開262144的話,顯存會超過16GB,速度會明顯下降。


簡易的數學問題,回答正確,但有時它會先說10.15大,然後最後又自證10.4大。

image.png

進行文章翻譯

image.png

進行圖片分析

image.png


測試Qwen3.5 4B Q4

4B可以在上下文全開262144的情況下,跑出78~80token/s的成績,圖片分析、跟9B測試的數學問題、文章翻譯,基本上4B都能做到。


用同一張圖進行圖片分析,4B給出的回應跟9B不太一樣,比較像是根據圖片來回應你的問題,9B則是只進行圖片分析。

image.png

image.png



測試Qwen3.5 2B Q4

2B可以在上下文全開262144的情況下,跑出150~154token/s的成績,圖片分析、跟9B測試的數學問題、文章翻譯,基本上2B都能做到。

2B模型就沒有思考功能了。

但問10.4 跟 10.15 哪個大,它一樣會有先說10.15大又自證10.4大。

image.png

圖片分析

image.png

image.png



測試Qwen3.5 0.8B Q8

0.8B可以在上下文全開262144的情況下,跑出188token/s的成績,圖片分析、跟9B測試的數學問題、文章翻譯,基本上0.8B都能做到。

跟2B模型一樣沒有思考功能。


圖片分析

image.png

image.png

文章翻譯

個人是覺得翻譯品質相較之前幾個模型,略過於簡潔。但假如是用來翻譯句子之類的,不是翻譯文章,0.8B似乎也行。

image.png

image.png

數學問題

image.png


老實說9B的速度反而低於我的預期,畢竟Qwen3.5 35B-A3B Q2 都能跑到50~70多了,9B速度也就差不多而已。但表現還是可以的。

反倒是0.8B、2B、4B,覺得更令我驚豔,尤其是0.8B、2B這兩個模型,以前其他這等級的模型基本上都會亂回答、不可控,但這次這兩個模型居然還不錯。現在真的小模型也能實現日常簡易用途了,當然還是沒法跟線上大模型比,例如上傳幾十MB的PDF要做分析,直接就報錯了,上下文太小。


至於這幾個模型的寫code能力,改天再測試了。(簡單測試了一下,9B模型也沒法正確寫出一個HTML數獨遊戲)


文章轉載或引用,請先告知並保留原文出處與連結!!(單純分享或非營利的只需保留原文出處,不用告知)

原文連結:
https://blog.aidec.tw/post/qwen35-test
若有業務合作需求,可寫信至: [email protected]
創業、網站經營相關內容未來將發布在 小易創業筆記