本帖最后由 Ref 于 2025-5-19 15:53 编辑
V3-Q8
Q8:Ollama官网(注意是原版不是0324更新后的V3)
M2硬盘
Windows
Ollama
默认设置(与R1时设置一致,因多次报错所以减少测试内容)
内存占用:699G
启动时间:12-15分钟
平均速度:1.85
1-5题+选择题+诗词:
eval count: 总575 token(s)
eval duration: 总206s
eval rate: 平均2.8tokens/s
中英:
eval count: 总1601 token(s)
eval duration: 总947s
eval rate: 平均1.69tokens/s
法语:
total duration: 4m49.8410931s load duration: 23.5847ms prompt eval count: 225 token(s) prompt eval duration: 17.4612615s prompt eval rate: 12.89 tokens/s eval count: 444 token(s) eval duration: 4m32.355706s eval rate: 1.63 tokens/s
阿拉伯语: total duration: 1m58.1501852s load duration: 24.8146ms prompt eval count: 166 token(s) prompt eval duration: 14.4389507s prompt eval rate: 11.50 tokens/s eval count: 202 token(s) eval duration: 1m43.6853376s eval rate: 1.95 tokens/s
总结:都按照要求执行,但是选择题选错了。 |