开yun体育网FP32 即是 32 位抒发一个参数-开云(中国)Kaiyun·官方网站 登录入口

快科技 8 月 25 日音问,近日,深度求索晓谕认真发布 DeepSeek-V3.1。其中一个要紧的逾越和惊喜,即是撑握了 UE8M0 FP8。

DeepSeek 在其官宣发布 DeepSeek-V3.1 的著述中提到,UE8M0 FP8 是针对行将发布的下一代国产芯片假想。
东莞证券指出,该递次通过更高的纯真度撑握复杂模子推理,升迁芯片的解码成果与运算智商,为国产芯片适配更大模子提供技能旅途,国产 AI 算力生态有望加快成型。
那 UE8M0 FP8 到底是什么?将有何影响?
东谈主工智能范畴的企业家与技能大师、清华大学规划机系东谈主工智能所博士梁斌示意,DeepSeek 此次为什么非要强调 UE8M0 FP8 呢?这个和英伟达的 FP8 是两个东西,两套圭臬。
他讲明称,显存的发展是有限的,而模子的发展是快速的,对每个参数的抒发必须通过量化进行压缩,FP32 即是 32 位抒发一个参数,FP8 即是 8 位抒发一个参数,在可接受的边界内,细目是越低的抒发,在显存内部能装下更多的参数。
FP8 有英伟达的 E4M3/E5M2 决策和 DS 的这个 UE8M0 决策,主要分别即是前者有 3-2 位的少量抒发,后者莫得少量抒发。前者精度好,后者功耗低,运算快,对芯片条目低。
梁斌示意,现时 DeepSeek 撑握 UE8M0 FP8,加上国产芯片王人向这个圭臬濒临,这是绝对和英伟达决裂了,以后其他推理模子,要么选择 DS 这套体系,要么选择英伟达体系,国内芯片公司也积极向这套体系濒临。
"现时华为他们那儿果然为了适配这个圭臬,果然玩命干,干成了即是名垂千古,多大吸引,何况我发现 DeepSeek 还果然有胆量,果然把国产大模子的发展推到了一个牛 X 的高度上去,太了不得了。"

