北斗六星网

标题: 国产AI模型DeepSeek R1 [打印本页]

作者: 兰羽 时间: 2025-1-26 17:45
标题: 国产AI模型DeepSeek R1

如果在AI大模型领域突然出现了一个足以挑战ChatGPT或者赶超ChatGPT的竞争者，而且这个竞争者还将先进/强大的AI（推理）模型开源；那么可能就会对ChatGPT的付费商业模式带来强烈的冲击——比如说，站在普通用户的角度来想，既然可以用更低的成本或者接近零成本使用到几乎同等强大的AI模型，那自然就没有理由花更多的钱使用ChatGPT（及其API）。OpenAI的ChatGPT因为有着全球领先的AI大模型如GPT-4o、o1以及即将上线的o3等，在市场上占得了先机——目前，ChatGPT的月度活跃用户超过3亿，付费订阅用户超过1千万；同时可以很确定的是，OpenAI希望可以借助闭源AI模型在技术上领先的优势继续发展更多的付费用户。

被一些人称为“神秘东方力量”的DeepSeek，最近在AI领域里连续投下两个重磅炸弹，先是推出了DeepSeek V3模型，后又推出了DeepSeek R1推理模型。DeepSeek V3的表现几乎追上了Anthropic Claude 3.5 Sonnet和OpenAI GPT-4o，而DeepSeek R1的表现实在太过惊艳，已经可以与OpenAI的推理模型o1相提并论。网上也流传，DeepSeek 正在开发更强大的推理模型DeepSeek R2。

有一个ChatGPT Pro付费用户@Leo Xiang就这样发帖说：“在Deepseek R1之前，OpenAI的o1还是领先中国的大模型厂商一代，Deepseek R1出来之后已经不存在代际差了。OpenAI如何说服大家购买他的200美元/月的ChatGPT Pro？”随后，他又补充道：“我也用ChatGPT Pro，也体验了DeepSeek R1, ChatGPT o1目前还是最强的存在；DeepSeek系列模型的提升速度让人刮目相看，我会时不时地体验一下DeepSeek的模型，感受一下它的进步。”

根据外媒最新报道称，由对冲基金经理梁文峰创立的DeepSeek，在本周一发布了推理模型 DeepSeek R1，并且通过一篇论文做了详尽的阐述。美国公司如OpenAI和Google DeepMind等在推理模型领域开辟了先河，这一相对较新的AI研究领域旨在让AI模型具备类似人类认知的能力。2024年12月，OpenAI才正式发布完整的o1推理模型。DeepSeek R1的发布引发了硅谷科技界关于美国AI公司（如Meta和Anthropic等）能否保持技术领先地位的激烈讨论。与此同时，在中美高科技激烈竞争博弈的当下，梁文峰也成为了备受瞩目的民族英雄。

2021年，梁文峰在运营量化交易基金幻方的期间，开始购买数千块英伟达图形处理单元（GPU芯片）用于AI研发。业界当时认为这不过是亿万富翁的新兴趣爱好。“最初见到他时，他是个书呆子模样，发型很糟糕，总是谈论用1万块芯片搭建集群训练模型。我们当时没把他当回事，”一位商业伙伴回忆道，“他无法清晰描述自己的愿景，只是说：‘我要做这个，它会改变游戏规则。’我们认为只有像字节跳动、阿里巴巴这样的巨头才可能做到。”

然而，梁文峰在AI领域的“外行”身份反而成为了一种意外的优势。在幻方，他通过AI和算法分析影响股价的模式积累了财富。他的团队熟练使用英伟达芯片进行交易。2023年，他创立了DeepSeek，宣布进军类人智能研发。“梁文峰带领着一支对芯片工作原理有深入了解的优秀团队，”一家竞争公司创始人表示，“他从对冲基金将最优秀的人才带入了DeepSeek。”

在美国禁止英伟达向中国出口高尖端AI GPU芯片之后，中国AI公司被迫创新，以最大化利用有限的本土芯片计算能力，而梁文峰的团队早已掌握了解决之道。“DeepSeek的工程师们能够挖掘GPU的潜力，即使它们并非最新的型号，”一位接近公司的AI研究员表示。

正因为DeepSeek对研究的专注，让自己在全球AI领域成为了一个实力强劲的竞争者。DeepSeek倾向于分享技术上的突破，而非将AI用于谋取商业利益。迄今为止，DeepSeek没有接受外部融资，也没有大规模商业化AI模型。梁文峰自己曾说过：“我们面临的问题从来不是钱，而是高端芯片被禁运。”当然，他也说过这样的话：“我们只是按照自己的步调来做事，然后核算成本定价，我们的原则是不赔钱，也不赚取暴利。”DeepSeek所需的资金主要由幻方量化提供支持。幻方量化在2024年的投资回报率不尽如人意，据说是与梁文峰将大部分精力放在DeepSeek有关。

梁文峰将DeepSeek定位为一家纯粹“本土化”的公司，DeepSeek核心团队成员来自北京大学、清华大学和北京航空航天大学等中国顶尖名校，而非拥有海外背景的专家。他曾表示：“我们的核心团队没有海外归来的人才。他们都是本土的……我们必须自己培养顶尖人才。”在人才层面，DeepSeek确实走了一条不同的路——这种纯粹中国化的身份定位在国内赢得了广泛赞誉。

DeepSeek仅用了2048张英伟达H800 GPU芯片和560万美元训练出了一个拥有6710亿参数的模型。而OpenAI和Google为训练出类似规模的模型，所投入的资源远远超过了这一水平。尽管DeepSeek在资源有限的情况之下获得了令人印象深刻的成果，然热业界人士仍认为，随着行业不断演变，DeepSeek未来在AI领域的竞争力尚待观察。与此同时，美国的竞争对手们并未止步不前。举例来说，OpenAI日前宣布了资金规模高达5000亿美元的“Stargate（星际之门）”计划——在美国AI基础设施领域投资；埃隆·马斯克的xAI也在扩展超级计算机Colossus，计划搭载超过100万块先进的GPU芯片，用于训练Grok AI模型；等等。“DeepSeek在中国拥有最大规模的高级计算集群之一，”梁文峰的商业伙伴称，“目前他们的计算能力尚足够，但这种优势不会持续太久。”

前面写道，OpenAI在2024年12月才正式面向用户发布上线完整的o1推理模型。换言之，DeepSeek R1推理模型的发布也就只比o1完整版推理模型晚了大约一个月而已。在海外社交平台上，最近几天关于DeepSeek及其推理模型R1的讨论，热度颇高，相关的贴文、评论等有很多很多。有的外国网友戏谑：DeepSeek才是OpenAI（开源AI），OpenAI是Closed AI（闭源AI）。

日前在匿名职场社区teamblind上，一位Meta公司员工发布的匿名贴子特别火——《Meta genai org in panic mode》，该贴子的中文意思是：

Meta的生成式AI团队陷入了恐慌状态。

这一切的开端是DeepSeek V3的推出，这让Llama 4在各项基准测试中全面落后。更让人雪上加霜的是，一家“未知的中国公司”用仅550万美元的预算完成了训练，直接打脸了现有的大型模型。

目前，工程师们正在疯狂拆解DeepSeek，试图复制其中的一切。我不是在夸张，事情就是这么紧迫。

管理层也在焦虑如何为生成式AI团队的高昂成本向高层交代。尤其是，当团队中每一位所谓的“领导者”拿到的薪水都远远超过了训练整个DeepSeek V3的成本，而这样的“领导者”团队却有数十人之多。

DeepSeek R1的出现让事情变得更加可怕。虽然有些信息还不能透露，但很快就会公开，到时候情况可能更加不利。

本来，这个团队应该是一个以工程为核心的小型组织，但因为一些人想借机刷存在感、抢占资源，人为地扩大了团队规模，结果反而让大家都成了输家。

就以今天的数据为例，在苹果App Store上的效率类应用排名榜上，在中国大陆地区，DeepSeek已经位居第2，直追第1名的豆包；在中国香港特区，DeepSeek位居第1，豆包降为第2名；在美国，DeepSeek排名第3，超过了第4名的谷歌Gemini，而第1名则是ChatGPT。在苹果App Store免费总榜排名上，在中国大陆地区，DeepSeek排名第24，豆包排名第2；在美国，DeepSeek排名第14，ChatGPT排名第1。可以这么说，DeepSeek在没有主动砸钱做营销推广的情况下，却在包括中国、美国等国内外地区开始“出圈”了。

作者: 兰羽 时间: 2025-1-26 17:49
研发团队成员完全来自国内高校，他们没有任何海外背景。由此说明中国科技的巨大进步，中国已经能够培养出世界顶尖科技人才。这是具有划时代意义的事情。

作者: 按倒就亲 时间: 2025-1-26 18:00
中国互联网企业的尽头就是放贷，除了这个可清场式领先，别的都不用吹。
时间放长点看，笑话做结局。

作者: 兰羽 时间: 2025-1-26 18:02

按倒就亲发表于 2025-1-26 18:00
中国互联网企业的尽头就是放贷，除了这个可清场式领先，别的都不用吹。
时间放长点看，笑话做结局。

是吗？时间会告诉你答案的，大概率你会很失望的~

作者: 螃蟹 时间: 2025-1-26 18:17
企业有党委没？这个DeepSeek好不好用的关键在于，它是不是也只能以官方价值观为自己的价值观……

作者: 知音 时间: 2025-1-26 18:23

国内自主开发的有个“ 智谱清言”Ai搜索特别厉害

作者: 螃蟹 时间: 2025-1-26 18:27
本帖最后由螃蟹于 2025-1-26 18:34 编辑

兰羽发表于 2025-1-26 17:49
研发团队成员完全来自国内高校，他们没有任何海外背景。由此说明中国科技的巨大进步，中国已经能够培养出世 ...

你所谓的“顶尖科技人才”，都还只会跟着他人屁股后头跑，不能发明创造。人家做啥成功了，他们也跟着做啥，只是产品比较廉价。呵呵。

作者: 周文王 时间: 2025-1-26 18:35

螃蟹发表于 2025-1-26 18:27
你所谓的“顶尖科技人才”，都还只会跟着他人屁股后头跑，不能发明创造。人家做啥成功了，他们也跟着做 ...

这种情况正在快速改变中。

因为你不在局里，所以感受不到。

作者: 周文王 时间: 2025-1-26 18:36
中国的原创思考，正处于爆发期，

只是还没有收获果实。

需要时间沉淀。

泥沙俱下，里面有狗头金。

作者: 螃蟹 时间: 2025-1-26 18:40
本帖最后由螃蟹于 2025-1-26 18:46 编辑

至于技术团队核心都是学生也没啥新奇，中国的技术类初创企业都喜欢招聘学生，因为他们比较便宜，也抗虐方便塑造。呵呵。

作者: 螃蟹 时间: 2025-1-26 18:47

周文王发表于 2025-1-26 18:35
这种情况正在快速改变中。

因为你不在局里，所以感受不到。

妲己，你还是找个背风的地儿算卦去吧。

作者: 按倒就亲 时间: 2025-1-26 18:47

兰羽发表于 2025-1-26 18:02
是吗？时间会告诉你答案的，大概率你会很失望的~

我倒希望自己看错了。但可惜，每次都提前几年算准了命。
只要沾上互联网，咱中国就谈不上优势和领先，这是底层逻辑决定了的。就跟行骗使诈，也没人能超越我们国家一样，谁来都不好使。
语言工具决定先天优势。

作者: 按倒就亲 时间: 2025-1-26 18:51

周文王发表于 2025-1-26 18:36
中国的原创思考，正处于爆发期，

只是还没有收获果实。

什么原创思考，你是指他们的网贷计算和清收模式吗？

作者: 周文王 时间: 2025-1-26 18:52

螃蟹发表于 2025-1-26 18:47
妲己，你还是找个背风的地儿算卦去吧。

螃蟹虽然机械，但直觉不错。

要说算卦，还真无敌手。

作者: 周文王 时间: 2025-1-26 18:54

按倒就亲发表于 2025-1-26 18:51
什么原创思考，你是指他们的网贷计算和清收模式吗？

张祥前之类的。

看似闹剧，实则有真思考。

作者: 兰羽 时间: 2025-1-26 18:55

螃蟹发表于 2025-1-26 18:17
企业有党委没？这个DeepSeek好不好用的关键在于，它是不是也只能以官方价值观为自己的价值观……

无法面对现实了，开始胡说八道？

作者: 兰羽 时间: 2025-1-26 18:55

知音发表于 2025-1-26 18:23
国内自主开发的有个“ 智谱清言”Ai搜索特别厉害

还没用过~

作者: 周文王 时间: 2025-1-26 18:58
中国人正在快速成长，

虽然看上去傻里傻气的，

但是有真东西。

作者: 兰羽 时间: 2025-1-26 18:58

螃蟹发表于 2025-1-26 18:27
你所谓的“顶尖科技人才”，都还只会跟着他人屁股后头跑，不能发明创造。人家做啥成功了，他们也跟着做 ...

事实是中国科技已经开始把欧洲甩在后面了，青出于蓝而胜于蓝美国的迹象已经显现~

作者: 螃蟹 时间: 2025-1-26 19:01
本帖最后由螃蟹于 2025-1-26 19:15 编辑

刚才我就试验了一把豆包，问了几个敏感问题。果然，只能按官方价值观，进行固定套路回答。问到紧要处，对方的回答则是：抱歉，我无法回答这个问题。

中国的所谓“人工智能”有先天缺陷。这不是科研人员努力能解决的。当技术，经济或社会发展到一定程度时，就需要匹配相适应的制度。而没有相应的制度，你的技术，经济或社会就发展不到一定的程度。有障碍。

作者: 兰羽 时间: 2025-1-26 19:02

按倒就亲发表于 2025-1-26 18:47
我倒希望自己看错了。但可惜，每次都提前几年算准了命。
只要沾上互联网，咱中国就谈不上优势和领先，这 ...

事实是，国内很多科技成果已经出乎你的意料，当然，你可以视而不见~

作者: 兰羽 时间: 2025-1-26 19:03

周文王发表于 2025-1-26 18:36
中国的原创思考，正处于爆发期，

只是还没有收获果实。

是的，我坚信这点~

作者: 兰羽 时间: 2025-1-26 19:04

螃蟹发表于 2025-1-26 19:01
刚才我就试验了一把豆包，问了几个敏感问题。果然，只能按官方价值观，进行固定思路的回答。问到紧要处，对 ...

当然，你可以有你的理解~

作者: 坐忘庄 时间: 2025-1-26 19:12
本帖最后由坐忘庄于 2025-1-27 10:22 编辑

哈哈哈

新赛道，起跑线一样。

万物皆可算。原理突破、既定，赛道清晰，优化可以理解。

算法不断更迭、优化，数据、成本不断降低。

没有尽头、包括芯片。摩尔定律。

作者: 螃蟹 时间: 2025-1-26 19:14

兰羽发表于 2025-1-26 18:58
事实是中国科技已经开始把欧洲甩在后面了，青出于蓝而胜于蓝美国的迹象已经显现~

也就是做做梦吧，永远的跟随者。呵呵。

作者: 周文王 时间: 2025-1-26 19:20

螃蟹发表于 2025-1-26 19:01
刚才我就试验了一把豆包，问了几个敏感问题。果然，只能按官方价值观，进行固定套路回答。问到紧要处，对方 ...

用星火也有同样的问题。

很容易断线，强制终止对话。

给人的体验很差。

所以基本上不用。

其实根本就没什么，和形态无关。

单纯就是思考而已。

作者: 周文王 时间: 2025-1-26 19:20

螃蟹发表于 2025-1-26 19:01
刚才我就试验了一把豆包，问了几个敏感问题。果然，只能按官方价值观，进行固定套路回答。问到紧要处，对方 ...

作者: 周文王 时间: 2025-1-26 19:22

螃蟹发表于 2025-1-26 19:14
也就是做做梦吧，永远的跟随者。呵呵。

这一点不同意。

还是有机会的。

老螃蟹是指望不上了，

缺少新意，思考需要具备构建概念的能力，

总是因袭前人，没劲。

作者: 周文王 时间: 2025-1-26 19:23
好比算命，AI生成文本，和算命很像。

原理相通。

作者: 兰羽 时间: 2025-1-26 19:25

螃蟹发表于 2025-1-26 19:14
也就是做做梦吧，永远的跟随者。呵呵。

哈哈，你祈祷未来如你所愿吧~

作者: 螃蟹 时间: 2025-1-26 19:28
本帖最后由螃蟹于 2025-1-26 19:30 编辑

坐忘庄发表于 2025-1-26 19:12
哈哈哈

新赛道，起跑线一样。

错了，不是“万物皆可算”，是允许你算的才能算，国产人工智能的智力上限，还是不能超过单位领导。呵呵。

作者: 周文王 时间: 2025-1-26 19:34

兰羽发表于 2025-1-26 19:25
哈哈，你祈祷未来如你所愿吧~

老螃蟹和他要批判的对象一样，

陷入了“信息茧房”以及“意义茧房”里去了，

无论什么情况，都要在自己的天枰上称一称。

老螃蟹有什么好天枰么，不过是八只爪子横着走而已。

作者: 坐忘庄 时间: 2025-1-26 19:35

螃蟹发表于 2025-1-26 19:28
错了，不是“万物皆可算”，而是允许你算的才能算，人工智能的智力上限，还是不能超过单位领导。呵呵。

哈哈哈点解

懂。

对于资本、技术，中美，都是权力合谋，差异是权力博弈的长期、短期。一次、多次。

长期，多次，您概念的可能会改。几率不大。

不改会扭曲技术、资本。低效、无效。

哈哈哈，缘起性空。

作者: 坐忘庄 时间: 2025-1-26 19:40
本帖最后由坐忘庄于 2025-1-26 19:56 编辑

另，螃蟹的大钳子夹几块价值多元的滋补，不形而上学一元

身心能到马里亚纳畅游。

大道至简。

作者: 兰羽 时间: 2025-1-26 19:46

周文王发表于 2025-1-26 19:34
老螃蟹和他要批判的对象一样，

陷入了“信息茧房”以及“意义茧房”里去了，

螃蟹决定的眼界低，看不完整整个世界~

作者: 坐忘庄 时间: 2025-1-26 19:52

兰羽发表于 2025-1-26 19:46
螃蟹决定的眼界低，看不完整整个世界~

哈哈哈

也有可能这年轻人老柳一样穿过权力的雷场，四大皆空了。

操盘沪上文宣，估计强体验强生活。

作者: 螃蟹 时间: 2025-1-26 20:14

周文王发表于 2025-1-26 19:34
老螃蟹和他要批判的对象一样，

陷入了“信息茧房”以及“意义茧房”里去了，

信息茧房，是说你接受的外界信息受限，就像作茧自缚的虫子一样。不是说看问题主观。

作者: 螃蟹 时间: 2025-1-26 20:25
本帖最后由螃蟹于 2025-1-26 20:28 编辑

坐忘庄发表于 2025-1-26 19:40
另，螃蟹的大钳子夹几块价值多元的滋补，不形而上学一元

身心能到马里亚纳畅游。

形而上学研究存在，是本体论。价值论则是道德伦理或实践范畴。一元论本体可以对应多元价值，不是只有多元本体才能对应多元价值。

作者: 坐忘庄 时间: 2025-1-26 20:37
本帖最后由坐忘庄于 2025-1-27 10:40 编辑

螃蟹发表于 2025-1-26 20:25
形而上学研究存在，是本体论。价值论则是道德伦理或实践范畴。一元论本体可以对应多元价值，不是只有多 ...

哈哈哈

以赛亚伯林。观念的力量。

挺好一个人、经历、书。

马基雅维里霍布斯是现代当代后现代哲学、政治哲学的启幕，伯林是现代人后现代人生活和哲学政治哲学的收官。智者涅槃。

作者: 河海森林 时间: 2025-1-27 10:04

兰羽发表于 2025-1-26 17:49
研发团队成员完全来自国内高校，他们没有任何海外背景。由此说明中国科技的巨大进步，中国已经能够培养出世 ...

用很少的gpu很少的资金已经很厉害了，如果没有gpu限制那还了得

欢迎光临北斗六星网 (http://154.85.43.82/)