[INTEL][双路768G][软件篇] Deepseek671b 个人部署记录
|
Ref
发表于 2025-4-10 20:38:31
|
显示全部楼层
4月10日:
在学习的同时,看到dify和coze的两种工作流派,一种偏向程序员,一种偏向直接开箱使用,我觉得这个也很有分析的必要。电脑虽然修好了装上linux,但是公司事情比较多,周末来应用。
|
|
|
|
|
|
|
Ref
发表于 2025-4-14 15:03:18
|
显示全部楼层
关于速度,我决定加购一个企业硬盘,测试一下ssd和企业机械硬盘下两个系统运行的速度差距。
[待更新]
|
|
|
|
|
|
|
Ref
发表于 2025-4-14 15:06:07
|
显示全部楼层
|
|
|
|
|
|
Ref
发表于 2025-4-15 14:44:26
|
显示全部楼层
本帖最后由 Ref 于 2025-4-15 16:31 编辑
接上文:
对llama.cpp编译后,在build/bin文件夹下打开终端,输入ls,查看是否有cli,bench.
cd或者在bulid/bin文件夹下,
输入:
./llama-cli -m ~/模型目录/模型名字.gguf
可以按tab补全名称
有三种llama,cli是对话,server是api,bench是跑分测试。
输入./llama-bench -m ~/模型目录/模型名称.gguf
可参考https://blog.csdn.net/weixin_46532327/article/details/144265501
注意:如果机子性能不强,测试不一定马上出结果,要等一会。
pp512是提示词长度
tg128是生成长度
|
|
|
|
|
|
|
Ref
发表于 2025-4-17 15:57:37
|
显示全部楼层
4月17日:
硬盘到了,接下来测试5个AI:
Deepseek-R1-671B-q4
Deepseek-R1-671B-q8
Deepseek-V3-q4
Deepseek-V3-q8
Gemma3
分别在两个环境和两种硬盘下测试:
Windows+Docker
Ubuntu22.04
SSD
机械
|
|
|
|
|
|