切换到宽版
北斗六星!·百事通·查看新帖·设为首页·手机版

北斗六星网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
北斗六星网 六星时事 六星杂谈 国产AI模型DeepSeek R1
查看: 1580|回复: 39
打印 上一主题 下一主题

国产AI模型DeepSeek R1 [复制链接]

跳转到指定楼层
主楼
发表于 2025-1-26 17:45 |只看该作者 |正序浏览 |
搜索本主题

如果在AI大模型领域突然出现了一个足以挑战ChatGPT或者赶超ChatGPT的竞争者,而且这个竞争者还将先进/强大的AI(推理)模型开源;那么可能就会对ChatGPT的付费商业模式带来强烈的冲击——比如说,站在普通用户的角度来想,既然可以用更低的成本或者接近零成本使用到几乎同等强大的AI模型,那自然就没有理由花更多的钱使用ChatGPT(及其API)。OpenAI的ChatGPT因为有着全球领先的AI大模型如GPT-4o、o1以及即将上线的o3等,在市场上占得了先机——目前,ChatGPT的月度活跃用户超过3亿,付费订阅用户超过1千万;同时可以很确定的是,OpenAI希望可以借助闭源AI模型在技术上领先的优势继续发展更多的付费用户。


被一些人称为“神秘东方力量”的DeepSeek,最近在AI领域里连续投下两个重磅炸弹,先是推出了DeepSeek V3模型,后又推出了DeepSeek R1推理模型。DeepSeek V3的表现几乎追上了Anthropic Claude 3.5 Sonnet和OpenAI GPT-4o,而DeepSeek R1的表现实在太过惊艳,已经可以与OpenAI的推理模型o1相提并论。网上也流传,DeepSeek 正在开发更强大的推理模型DeepSeek R2。


有一个ChatGPT Pro付费用户@Leo Xiang就这样发帖说:“在Deepseek R1之前,OpenAI的o1还是领先中国的大模型厂商一代,Deepseek R1出来之后已经不存在代际差了。OpenAI如何说服大家购买他的200美元/月的ChatGPT Pro?”随后,他又补充道:“我也用ChatGPT Pro,也体验了DeepSeek R1, ChatGPT o1目前还是最强的存在;DeepSeek系列模型的提升速度让人刮目相看,我会时不时地体验一下DeepSeek的模型,感受一下它的进步。”




根据外媒最新报道称,由对冲基金经理梁文峰创立的DeepSeek,在本周一发布了推理模型 DeepSeek R1,并且通过一篇论文做了详尽的阐述。美国公司如OpenAI和Google DeepMind等在推理模型领域开辟了先河,这一相对较新的AI研究领域旨在让AI模型具备类似人类认知的能力。2024年12月,OpenAI才正式发布完整的o1推理模型。DeepSeek R1的发布引发了硅谷科技界关于美国AI公司(如Meta和Anthropic等)能否保持技术领先地位的激烈讨论。与此同时,在中美高科技激烈竞争博弈的当下,梁文峰也成为了备受瞩目的民族英雄。




2021年,梁文峰在运营量化交易基金幻方的期间,开始购买数千块英伟达图形处理单元(GPU芯片)用于AI研发。业界当时认为这不过是亿万富翁的新兴趣爱好。“最初见到他时,他是个书呆子模样,发型很糟糕,总是谈论用1万块芯片搭建集群训练模型。我们当时没把他当回事,”一位商业伙伴回忆道,“他无法清晰描述自己的愿景,只是说:‘我要做这个,它会改变游戏规则。’我们认为只有像字节跳动、阿里巴巴这样的巨头才可能做到。”


然而,梁文峰在AI领域的“外行”身份反而成为了一种意外的优势。在幻方,他通过AI和算法分析影响股价的模式积累了财富。他的团队熟练使用英伟达芯片进行交易。2023年,他创立了DeepSeek,宣布进军类人智能研发。“梁文峰带领着一支对芯片工作原理有深入了解的优秀团队,”一家竞争公司创始人表示,“他从对冲基金将最优秀的人才带入了DeepSeek。”


在美国禁止英伟达向中国出口高尖端AI GPU芯片之后,中国AI公司被迫创新,以最大化利用有限的本土芯片计算能力,而梁文峰的团队早已掌握了解决之道。“DeepSeek的工程师们能够挖掘GPU的潜力,即使它们并非最新的型号,”一位接近公司的AI研究员表示。


正因为DeepSeek对研究的专注,让自己在全球AI领域成为了一个实力强劲的竞争者。DeepSeek倾向于分享技术上的突破,而非将AI用于谋取商业利益。迄今为止,DeepSeek没有接受外部融资,也没有大规模商业化AI模型。梁文峰自己曾说过:“我们面临的问题从来不是钱,而是高端芯片被禁运。”当然,他也说过这样的话:“我们只是按照自己的步调来做事,然后核算成本定价,我们的原则是不赔钱,也不赚取暴利。”DeepSeek所需的资金主要由幻方量化提供支持。幻方量化在2024年的投资回报率不尽如人意,据说是与梁文峰将大部分精力放在DeepSeek有关。


梁文峰将DeepSeek定位为一家纯粹“本土化”的公司,DeepSeek核心团队成员来自北京大学、清华大学和北京航空航天大学等中国顶尖名校,而非拥有海外背景的专家。他曾表示:“我们的核心团队没有海外归来的人才。他们都是本土的……我们必须自己培养顶尖人才。”在人才层面,DeepSeek确实走了一条不同的路——这种纯粹中国化的身份定位在国内赢得了广泛赞誉。


DeepSeek仅用了2048张英伟达H800 GPU芯片和560万美元训练出了一个拥有6710亿参数的模型。而OpenAI和Google为训练出类似规模的模型,所投入的资源远远超过了这一水平。尽管DeepSeek在资源有限的情况之下获得了令人印象深刻的成果,然热业界人士仍认为,随着行业不断演变,DeepSeek未来在AI领域的竞争力尚待观察。与此同时,美国的竞争对手们并未止步不前。举例来说,OpenAI日前宣布了资金规模高达5000亿美元的“Stargate(星际之门)”计划——在美国AI基础设施领域投资;埃隆·马斯克的xAI也在扩展超级计算机Colossus,计划搭载超过100万块先进的GPU芯片,用于训练Grok AI模型;等等。“DeepSeek在中国拥有最大规模的高级计算集群之一,”梁文峰的商业伙伴称,“目前他们的计算能力尚足够,但这种优势不会持续太久。”




前面写道,OpenAI在2024年12月才正式面向用户发布上线完整的o1推理模型。换言之,DeepSeek R1推理模型的发布也就只比o1完整版推理模型晚了大约一个月而已。在海外社交平台上,最近几天关于DeepSeek及其推理模型R1的讨论,热度颇高,相关的贴文、评论等有很多很多。有的外国网友戏谑:DeepSeek才是OpenAI(开源AI),OpenAI是Closed AI(闭源AI)。


日前在匿名职场社区teamblind上,一位Meta公司员工发布的匿名贴子特别火——《Meta genai org in panic mode》,该贴子的中文意思是:


Meta的生成式AI团队陷入了恐慌状态。


这一切的开端是DeepSeek V3的推出,这让Llama 4在各项基准测试中全面落后。更让人雪上加霜的是,一家“未知的中国公司”用仅550万美元的预算完成了训练,直接打脸了现有的大型模型。


目前,工程师们正在疯狂拆解DeepSeek,试图复制其中的一切。我不是在夸张,事情就是这么紧迫。


管理层也在焦虑如何为生成式AI团队的高昂成本向高层交代。尤其是,当团队中每一位所谓的“领导者”拿到的薪水都远远超过了训练整个DeepSeek V3的成本,而这样的“领导者”团队却有数十人之多。


DeepSeek R1的出现让事情变得更加可怕。虽然有些信息还不能透露,但很快就会公开,到时候情况可能更加不利。


本来,这个团队应该是一个以工程为核心的小型组织,但因为一些人想借机刷存在感、抢占资源,人为地扩大了团队规模,结果反而让大家都成了输家。








就以今天的数据为例,在苹果App Store上的效率类应用排名榜上,在中国大陆地区,DeepSeek已经位居第2,直追第1名的豆包;在中国香港特区,DeepSeek位居第1,豆包降为第2名;在美国,DeepSeek排名第3,超过了第4名的谷歌Gemini,而第1名则是ChatGPT。在苹果App Store免费总榜排名上,在中国大陆地区,DeepSeek排名第24,豆包排名第2;在美国,DeepSeek排名第14,ChatGPT排名第1。可以这么说,DeepSeek在没有主动砸钱做营销推广的情况下,却在包括中国、美国等国内外地区开始“出圈”了。



分享到: QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
分享分享0 收藏收藏0 顶0 踩0

40
发表于 2025-1-27 10:04 |只看该作者
兰羽 发表于 2025-1-26 17:49
研发团队成员完全来自国内高校,他们没有任何海外背景。由此说明中国科技的巨大进步,中国已经能够培养出世 ...

用很少的gpu很少的资金已经很厉害了,如果没有gpu限制那还了得

使用道具 举报

39
发表于 2025-1-26 20:37 来自手机 |只看该作者
本帖最后由 坐忘庄 于 2025-1-27 10:40 编辑
螃蟹 发表于 2025-1-26 20:25
形而上学研究存在,是本体论。价值论则是道德伦理或实践范畴。一元论本体可以对应多元价值,不是只有多 ...


哈哈哈

以赛亚伯林。观念的力量。

挺好一个人、经历、书。

马基雅维里霍布斯是现代当代后现代哲学、政治哲学的启幕,伯林是现代人后现代人生活和哲学政治哲学的收官。智者涅槃。

使用道具 举报

38
发表于 2025-1-26 20:25 来自手机 |只看该作者
本帖最后由 螃蟹 于 2025-1-26 20:28 编辑
坐忘庄 发表于 2025-1-26 19:40
另,螃蟹的大钳子夹几块价值多元的滋补,不形而上学一元

身心能到马里亚纳畅游。


形而上学研究存在,是本体论。价值论则是道德伦理或实践范畴。一元论本体可以对应多元价值,不是只有多元本体才能对应多元价值。

使用道具 举报

37
发表于 2025-1-26 20:14 来自手机 |只看该作者
周文王 发表于 2025-1-26 19:34
老螃蟹和他要批判的对象一样,

陷入了“信息茧房”以及“意义茧房”里去了,

信息茧房,是说你接受的外界信息受限,就像作茧自缚的虫子一样。不是说看问题主观。

使用道具 举报

36
发表于 2025-1-26 19:52 来自手机 |只看该作者
兰羽 发表于 2025-1-26 19:46
螃蟹决定的眼界低,看不完整整个世界~

哈哈哈

也有可能这年轻人老柳一样穿过权力的雷场,四大皆空了。

操盘沪上文宣,估计强体验强生活。

使用道具 举报

35
发表于 2025-1-26 19:46 |只看该作者
周文王 发表于 2025-1-26 19:34
老螃蟹和他要批判的对象一样,

陷入了“信息茧房”以及“意义茧房”里去了,

螃蟹决定的眼界低,看不完整整个世界~

使用道具 举报

34
发表于 2025-1-26 19:40 来自手机 |只看该作者
本帖最后由 坐忘庄 于 2025-1-26 19:56 编辑

另,螃蟹的大钳子夹几块价值多元的滋补,不形而上学一元

身心能到马里亚纳畅游。

大道至简。

使用道具 举报

33
发表于 2025-1-26 19:35 来自手机 |只看该作者
螃蟹 发表于 2025-1-26 19:28
错了,不是“万物皆可算”,而是允许你算的才能算,人工智能的智力上限,还是不能超过单位领导。呵呵。

哈哈哈 点解

懂。

对于资本、技术,中美,都是权力合谋,差异是权力博弈的长期、短期。一次、多次。

长期,多次,您概念的可能会改。几率不大。

不改会扭曲技术、资本。低效、无效。

哈哈哈,缘起性空。

使用道具 举报

32
发表于 2025-1-26 19:34 |只看该作者
兰羽 发表于 2025-1-26 19:25
哈哈,你祈祷未来如你所愿吧~

老螃蟹和他要批判的对象一样,

陷入了“信息茧房”以及“意义茧房”里去了,

无论什么情况,都要在自己的天枰上称一称。

老螃蟹有什么好天枰么,不过是八只爪子横着走而已。

使用道具 举报

31
发表于 2025-1-26 19:28 来自手机 |只看该作者
本帖最后由 螃蟹 于 2025-1-26 19:30 编辑
坐忘庄 发表于 2025-1-26 19:12
哈哈哈

新赛道,起跑线一样。


错了,不是“万物皆可算”,是允许你算的才能算,国产人工智能的智力上限,还是不能超过单位领导。呵呵。

使用道具 举报

30
发表于 2025-1-26 19:25 |只看该作者
螃蟹 发表于 2025-1-26 19:14
也就是做做梦吧,永远的跟随者。呵呵。

哈哈,你祈祷未来如你所愿吧~

使用道具 举报

29
发表于 2025-1-26 19:23 |只看该作者
好比算命,AI生成文本,和算命很像。

原理相通。

使用道具 举报

28
发表于 2025-1-26 19:22 |只看该作者
螃蟹 发表于 2025-1-26 19:14
也就是做做梦吧,永远的跟随者。呵呵。

这一点不同意。

还是有机会的。

老螃蟹是指望不上了,

缺少新意,思考需要具备构建概念的能力,

总是因袭前人,没劲。

使用道具 举报

27
发表于 2025-1-26 19:20 |只看该作者
螃蟹 发表于 2025-1-26 19:01
刚才我就试验了一把豆包,问了几个敏感问题。果然,只能按官方价值观,进行固定套路回答。问到紧要处,对方 ...

用星火也有同样的问题。

很容易断线,强制终止对话。

给人的体验很差。

所以基本上不用。

其实根本就没什么,和形态无关。

单纯就是思考而已。

使用道具 举报

26
发表于 2025-1-26 19:20 |只看该作者
螃蟹 发表于 2025-1-26 19:01
刚才我就试验了一把豆包,问了几个敏感问题。果然,只能按官方价值观,进行固定套路回答。问到紧要处,对方 ...

用星火也有同样的问题。

很容易断线,强制终止对话。

给人的体验很差。

所以基本上不用。

其实根本就没什么,和形态无关。

单纯就是思考而已。

使用道具 举报

25
发表于 2025-1-26 19:14 来自手机 |只看该作者
兰羽 发表于 2025-1-26 18:58
事实是中国科技已经开始把欧洲甩在后面了,青出于蓝而胜于蓝美国的迹象已经显现~

也就是做做梦吧,永远的跟随者。呵呵。

使用道具 举报

24
发表于 2025-1-26 19:12 来自手机 |只看该作者
本帖最后由 坐忘庄 于 2025-1-27 10:22 编辑

哈哈哈

新赛道,起跑线一样。

万物皆可算。原理突破、既定,赛道清晰,优化可以理解。

算法不断更迭、优化,数据、成本不断降低。

没有尽头、包括芯片。摩尔定律。

使用道具 举报

23
发表于 2025-1-26 19:04 |只看该作者
螃蟹 发表于 2025-1-26 19:01
刚才我就试验了一把豆包,问了几个敏感问题。果然,只能按官方价值观,进行固定思路的回答。问到紧要处,对 ...

当然,你可以有你的理解~

使用道具 举报

22
发表于 2025-1-26 19:03 |只看该作者
周文王 发表于 2025-1-26 18:36
中国的原创思考,正处于爆发期,

只是还没有收获果实。

是的,我坚信这点~

使用道具 举报

21
发表于 2025-1-26 19:02 |只看该作者
按倒就亲 发表于 2025-1-26 18:47
我倒希望自己看错了。但可惜,每次都提前几年算准了命。
只要沾上互联网,咱中国就谈不上优势和领先,这 ...

事实是,国内很多科技成果已经出乎你的意料,当然,你可以视而不见~

使用道具 举报

20
发表于 2025-1-26 19:01 来自手机 |只看该作者
本帖最后由 螃蟹 于 2025-1-26 19:15 编辑

刚才我就试验了一把豆包,问了几个敏感问题。果然,只能按官方价值观,进行固定套路回答。问到紧要处,对方的回答则是:抱歉,我无法回答这个问题。

中国的所谓“人工智能”有先天缺陷。这不是科研人员努力能解决的。当技术,经济或社会发展到一定程度时,就需要匹配相适应的制度。而没有相应的制度,你的技术,经济或社会就发展不到一定的程度。有障碍。

使用道具 举报

19
发表于 2025-1-26 18:58 |只看该作者
螃蟹 发表于 2025-1-26 18:27
你所谓的“顶尖科技人才”,都还只会跟着他人屁股后头跑,不能发明创造。人家做啥成功了,他们也跟着做 ...

事实是中国科技已经开始把欧洲甩在后面了,青出于蓝而胜于蓝美国的迹象已经显现~

使用道具 举报

18
发表于 2025-1-26 18:58 |只看该作者
中国人正在快速成长,

虽然看上去傻里傻气的,

但是有真东西。

使用道具 举报

17
发表于 2025-1-26 18:55 |只看该作者
知音 发表于 2025-1-26 18:23
国内自主开发的有个“ 智谱清言”Ai搜索特别厉害

还没用过~

使用道具 举报

16
发表于 2025-1-26 18:55 |只看该作者
螃蟹 发表于 2025-1-26 18:17
企业有党委没?这个DeepSeek好不好用的关键在于,它是不是也只能以官方价值观为自己的价值观……

无法面对现实了,开始胡说八道?

使用道具 举报

15
发表于 2025-1-26 18:54 |只看该作者
按倒就亲 发表于 2025-1-26 18:51
什么原创思考,你是指他们的网贷计算和清收模式吗?

张祥前之类的。

看似闹剧,实则有真思考。

使用道具 举报

14
发表于 2025-1-26 18:52 |只看该作者
螃蟹 发表于 2025-1-26 18:47
妲己,你还是找个背风的地儿算卦去吧。

螃蟹虽然机械,但直觉不错。

要说算卦,还真无敌手。


使用道具 举报

13
发表于 2025-1-26 18:51 来自手机 |只看该作者
周文王 发表于 2025-1-26 18:36
中国的原创思考,正处于爆发期,

只是还没有收获果实。

什么原创思考,你是指他们的网贷计算和清收模式吗?

使用道具 举报

12
发表于 2025-1-26 18:47 来自手机 |只看该作者
兰羽 发表于 2025-1-26 18:02
是吗?时间会告诉你答案的,大概率你会很失望的~

我倒希望自己看错了。但可惜,每次都提前几年算准了命。
只要沾上互联网,咱中国就谈不上优势和领先,这是底层逻辑决定了的。就跟行骗使诈,也没人能超越我们国家一样,谁来都不好使。
语言工具决定先天优势。

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

北斗六星文学网所有文字仅代表作者个人言论,本站不对其内容承负任何责任。

Copyright ©2011 bdlxbbs.cn All Right Reserved.  Powered by Discuz! 

本站信息均由会员发表,不代表本网站立场,如侵犯了您的权利请发帖投诉   

平平安安
TOP
返回顶部