Skip to content

DeepSeek封神时刻

欢迎来到以DeepSeek以代表的AI世界,我是doc-war.com的越石父,一个技术主义者。

知行合一,继续用DeepSeek写DeepSeek教程。

助理局限

AI不是万能的!

image-20250303160148313

我刚刚做了一个关于提问的错误示范!也毫无意外的获得了不满意的答案。未来,你将无数次听到我不断强调:“AI不是万能的!”

避免PUA人工智能

通用人工智能(AGI)虽然知识渊博且全能,但他始终是一个初混职场的助理,如果你的沟通偏情感化需求不明确,或者范围太宽泛全是形容词,且毫无背景提示,他则会困惑,丢失方向、丢失焦点,给出明显偏离预期的答案,最后,你这个上司即使没有指责他答非所问,失望之色也不免呈现脸上。

而这个过程如果发生在现实中,职场的牛马,通常称之为PUA!

一个合格的领导者,不能总是轻松在上,置身局外,成果归我,锅送助理。必要的时候,需要以身入局,方可胜天半子。这个问题,我代DeepSeek回答。

一、封神一刻

DeepSeek干了三件大事:

  • 破风,算法创新,深度思考过程展开,功能大放异彩,有点类似当年的微信语音对讲创新
  • 惊龙,业务架构分层设计和工程优化,算力成本只有ChatGPT等主流LLM的二十分之一左右
  • 碎天,开源策略,有点类似当年Android用开放对抗苹果封闭生态。这使得此前望洋兴叹被算力成本劝退的小企业和小国家,也能以较低成本使用先进的AI技术。

这套《裂国剑法》,经过一段时间的用户体验话题发酵,最终于2025年1月25日让DeepSeek一夜爆火全球,因堪称离谱的低廉算力成本新闻,引发了市场震荡,投资者担心这可能会大规模减少对高端芯片的需求,致使全球第一股、显卡芯片巨头英伟达,在下一个工作日(2025年1月27日),股价单日暴跌17%,跌掉大约4万亿人民币的市值,创下美国公司单日市值损失的历史纪录。

由此彻底出圈,搞出了一个全球性品牌。

随后DeepSeek旗下同名App超越ChatGPT,登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,更有新闻宣称其登顶140国地区榜首。(该榜基本为算法驱动,除非有明确证据证明违法、作弊,否则不会人工干预)

二、历史功绩

推理功能开源其实都不是DeepSeek首创,且DeepSeek模型距离顶尖的LLM的核心指标(比如数据量级上下文窗口量级时效性准确性),依然是有明显的距离,要说赶超ChatGPT为首的欧美巨头为时尚早,其成功更多源于剑走偏锋的产品层创新,针对理解需求带来了更高的敏锐度。

事实上,即便是对于算力成本低廉的市场影响,也随后发生反转,因为DeepSeek不错的表现+开源,大幅降低了理论门槛,导致了更多的企业和国家宣布进入,投资人预期将加速AI生态的繁荣,进而产生更多的算力需求,不但不会冲击英伟达,反而将进一步扩大其繁荣。后续的故事,是英伟达股价很快又大幅反弹了回去。

换句话说,站到更长的尺度,从人工智能大模型(AI)的发展历程去看,算力效率的提升也是必然,没有DeepSeek,也会有CeepSeek、EeepSeek,故事也将如此。

image-20250302190746734

尽管DeepSeek享誉全球,但DeepSeek在整个AI生态史上,更多在于推动AI价值向普通老百姓的普及,你可能惊讶发现,这个春节,那些小城市信息相对闭塞的兄弟大婶,居然,因为中国小公司暴打美国科技龙头的新闻,也开始讨论DeepSeek,听说过“AI”这个词了。

这,是ChatGPT和其他人工智能LLM,过去一两年都没有实现的热度,且几乎发生在一夜之间。

无论是国外以ChatGPT为代表的顶级LLM,还是国内百度宣称占据80%用户AI时长的文心一言,或着抖音宣称用户过亿的豆包,都没有实现这个目标,对于这一点,我们通过goolge、百度的搜索指数,均能看出有4~5倍的热度量级差距。

image-20250302190905679

反倒是AI赛道落后了2年濒临淘汰的腾讯,凭借最快上线DeepSeek镜像服务,实现100倍爆发式增长。打了一个翻身仗。

image-20250310092035038

正所谓“旧时王谢堂前燕,飞入寻常百姓家”,这是一个非技术的里程碑,也是DeepSeek在第四次工业革命长河里,真正的历史功绩。

三、衡量维度

为什么说:

尽管DeepSeek享誉全球,但DeepSeek在整个AI发展史上,更多在于推动AI价值向普通老百姓的普及,只是一个非技术的里程碑。

因为站在整个人类文明的高度,DeepSeek的权重数据集距离ChatGPT还有巨大的距离。实际体验,敏锐度尤其是类比逻辑可圈可点,时有惊喜,但精准度还有较大差距,单从数据量级上看,DeepSeek-R1-671B才600 亿参数,相比GPT-41.8 万亿参数,差了不止一个量级。

image-20250226135049358

也可以这么说,除了时效性上下文窗口大小推理精准度目标敏锐度数据量级,可以视为衡量大模型(LLM)的三大支柱指标。数据量级决定潜能;精准度和敏锐度决定实际表现。

但不管怎么说,DeepSeek创造了一个传奇,并且展现了创造力,人们愿意相信他具备挑战AI珠穆朗玛的潜能。