Skip to content

权重数据集

欢迎来到以DeepSeek以代表的AI世界,我是doc-war.com的越石父,一个技术主义者。

知行合一,用DeepSeek写DeepSeek教程。

推荐提问

  • 什么是数字孪生?

  • 有人说,权重数据集 是人类智慧的累积,代表了“人类价值”。而推理能力是AI 产业的核心竞争力,决定了 LLM 的“商业价值”。对吗?

  • 也有人说,推理能力较容易追平,是追赶者的捷径,而权重数据集耗资巨大,是领头羊的责任,对吗?

一、数字孪生

人工智能真正的价值载体形态,是权重数据集——这些数据集是人类知识之间的关系浓缩,是整个人类文明的数字结晶,它封装了知识的沉淀

  • 从存储上说,目前这部分价值,是平台相关的,ChatGPT、Claude、DeepSeek、Grok......等等各家都略有不同,也是技术相关的,目前都生长在Transformer架构之上。
  • 但从价值上说,知识关系在逻辑上是平台无关的。即便未来底层创新,导致Transformer架构被颠覆,只要经过蒸馏,转换,价值还在。

二、理解现象

今天我们使用DeepSeek,用第五感去看,你只能看见DeepSeek这个完整品牌。

image-20250310152441125

用第六感去解读,数据和推理则是两个价值层面的概念:内核层应用层,这个过程中,还涉及到了外部数据源的检索调用。

image-20250227094951213

这就是为什么,以ChatGPT、Claude为代表的顶级LLM,资金大部分都是砸在数据训练上的原因。(像极了代表熟人关系链的微信好友数据,这才是微信不可逾越的核心竞争力。)

而DeepSeek所创新的位置,在推理层,这是只要拼产品设计力就可能出奇迹的生态位。这也是为什么,会出现下面的这样新闻。

image-20250310153442108