资讯
门户
Portal
论坛
BBS
圈子
Group
搜索
本版
文章
帖子
圈子
立即登录
免费注册
Discuz! Board
»
论坛
›
AI频道
›
软件部署
›
[本地部署][Q4量化][18TPS]苹果最新M3 Ultra 512GB本地 ...
赞
回答
收藏
分享
[本地部署][Q4量化][18TPS]苹果最新M3 Ultra 512GB本地部署测试
软件部署
550 人阅读
|
0 人回复
|
2025-03-18
Ref
Ref
当前离线
积分
344
36
主题
43
回帖
344
积分
超级版主
积分
344
发消息
本帖最后由 Ref 于 2025-3-18 17:32 编辑
目前看M3 Ultra 512G作为不用自己搭建的品牌机而言,性价比要比其他的高很多。
671b Q4量化版
,借由苹果自己的MLX和deepseek R1的MOE模型,可以跑到
18token/s
,这个成绩相当不错。但是长上下文恢复正常,还是只有
6TPS
.
附上国内外的测评报告:
https://www.reddit.com/r/LocalLL ... tra_512gb_with_mlx/
https://www.bilibili.com/video/BV1icQ8YLEss/
目前苹果M3 512G 2T版本,是7.7W人民币或者7.6万港币,有条件的建议从香港买了带回来,可以赚一点差价。
MLX是什么?
MLX
是一个适用于苹果芯片的机器学习框架。
可参考
https://blog.csdn.net/Gloamirror/article/details/135038859
代码位置:
https://gitcode.com/gh_mirrors/m ... _github_accelerator
分享到:
回复
举报
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
Ref
LV16
344
积分
36
主题
Ref
发表主题 36