正文 国产之光DeepSeek把AI大佬全炸出来了!671B大模型训练只需此前算力1/10,细节全公开 facai369 V管理员 /2024-12-28 17:11:15/3阅读/0评论 1228 文章最后更新时间2024年12月28日,若文章内容或图片失效,请留言反馈! 物联网技术 DeepSeek新版模型正式发布,技术大佬们都转疯了! 延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,直接用了53页论文把训练细节和盘托出的那种。 怎么说呢,QLoRA一作的一个词评价就是: