中国人工智能公司DeepSeek推出的新AI模型引起了硅谷的关注。(图片来源:STR/AFP via Getty Images)
【看中国2025年1月27日讯】(看中国记者闻天清编译/综合报导)中国一家鲜为人知的人工智能(AI)公司DeepSeek(全称:杭州深度求索人工智能基础技术研究有限公司)发布了人工智能模型,并宣称尽管成本更低、芯片性能更低,但其性能却超越美国最好的AI模型,这令整个硅谷感到震撼。
DeepSeek新AI模型震撼美国硅谷
美国消费者新闻与商业频道(CNBC)报导,这个名为DeepSeek的中国人工智能公司在去年12底推出了一个免费的开源大型AI语言模型DeepSeek-V3。据称,在使用了英伟达(Nvidia)的低性能芯片H800s的情况下,这个AI模型仅用了2个月的时间完成构建,其成本不到600万美元。
DeepSeek的AI新模型,引发了外界对华盛顿在人工智能领域的全球领先优势是否正在缩小的担忧,并对大型科技公司在建立人工智能模型和资料中心方面的巨额投入提出了质疑。
在一系列第三方基准测试中,在从复杂问题解决到数学和编码的准确度方面,DeepSeek新AI模型均名列前茅,其整体表现表现优于Meta(脸书、Instagram和Threads母公司)的Llama 3.1、OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5。
1月20日,DeepSeek发布了其AI推理模型DeepSeek-R1,该模型在许多第三方测试中的表现也优于OpenAI最新模型o1。
微软首席执行官(CEO)萨蒂亚·纳德拉(Satya Nadella)在世界人工智能大会上表示:“DeepSeek的新模型非常令人印象深刻,他们不仅有效地开发了一个开源模型,实现了推理时间计算,而且计算效率极高。我们应该非常、非常认真地对待中国(AI)的发展。”
在美国政府对北京当局实施严格半导体限制措施的情况下,这使得中国无法获得英伟达的H100等性能最强的芯片。最新AI模型的进展显示,DeepSeek要么找到了规避美国芯片禁令的方法,要么华盛顿出口管制并非那么严格。
在接受媒体采访时,Benchmark普通合伙人Chetan Puttagunta表示:“他们可以采用一个非常好的大型模型,并使用一种称为蒸馏(distillation)的方法。基本上,你使用一个非常大的模型来帮助你的小模型在你想要它变得聪明的事情上变得聪明。这实际上是非常划算的。”
外界对于中国人工智能公司DeepSeek及其创始人梁文峰(Liang Wenfeng)知之甚少。根据媒体报道,DeepSeek是由一家名为“幻方量化”(High-Flyer)的中国对冲基金创建的,该基金管理约80亿美元的资产。
然而,DeepSeek并非唯一一家取得AI模型进展的中国公司。
领先的人工智能专家李开复表示,他的新创公司AI模型“零一万物”(01.AI)仅花费了300万美元。
1月22日,社交媒体抖音(TikTok)母公司“字节跳动”(ByteDance)发布了其模型的更新,声称在一项关键基准测试中超越了OpenAI的模型o1。
Perplexity首席执行官Aravind Srinivas说:“需求是发明之母。因为他们必须找到解决办法,所以他们最终建造了更有效率的产品。”
Meta首席AI专家:DeepSeek进展显示开源模型正超越专有模型
Business Insider报导,在发布新AI模型DeepSeek-R1之后,中国开源人工智能公司DeepSeek的快速崛起引起了硅谷的关注。在第三方基准测试中,其表现优于OpenAI、Meta、Anthropic等美国领先的人工智能公司。
Meta首席人工智能专家 Yann LeCun认为,DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁,而是保持人工智能模式开源的价值,以便任何人都能受益。
LeCun在社交媒体Threads 上一篇帖文中表示,这并代表中国的人工智能水平“超越了美国”,而是AI的“开源模型正在超越专有模型”。DeepSeek“受益于开放研究和开源”,这就是开放研究和开源的力量。
DeepSeek R1本身是开源的AI模型,Meta的Llama也同样是开源模型。 OpenAI最初成立时是一家开源人工智能公司,但最近已转向闭源。
1月20日,DeepSeek在发布AI新模型DeepSeek-R1时称,其“展示了卓越的推理能力”,它正在“突破开源AI的界限”。
DeepSeek宣布这一消息数日后,Meta首席执行官马克·扎克伯格(Mark Zuckerberg )宣布,该公司计划2025年在人工智能领域投资超过600亿美元。扎克伯格一直倡导AI开源模式。
支持AI开源模型的人表示,由于任何人都可以修改和重新分发程序编码,开源模型可以让科技快速、民主地发展。另一方面,闭源模型的支持者认为它们更安全,因为程序编码是保密的。
拜登芯片禁令难阻北京高科技雄心
《金融时报》报导,尽管拜登的芯片禁令试图阻止北京高科技雄心,掌管对冲基金的中国亿万富翁梁文峰创建的DeepSeek在财务预算紧张的情况下依然建造AI新模型DeepSeek R1。
在美国政府禁止英伟达向中国出口其性能最强的芯片后,中国人工智能公司被迫寻找创新的方法来最大限度地发挥有限数量芯片的运算能力,很显然,而梁文峰旗下的DeepSeek已经掌握了解决这个问题的方法。
在接受媒体采访时,一位接近DeepSeek的人工智能研究人员说:“DeepSeek工程师知道如何充分发挥这些GPU的潜力,即使它们不是最高端的科技产品。”
业内人士表示,DeepSeek 专注于研究,这使其成为一个危险的竞争对手,因为它愿意分享其突破,而不是为了商业利益而保护它们。 DeepSeek 尚未从外部基金筹集资金,也没有采取重大措施将其模式货币化。
北京一位人工智能投资者称:“DeepSeek的运作方式与 DeepMind早期的营运方式相似。” 主要专注于AI的研发和相关人工智能项目。
DeepSeek和High-Flyer 尚未回应置评请求。
根据DeepSeek发布的声明称,这个包含 6,710 亿个参数的新AI模型只使用了 2048 块英伟达H800芯片,成本费用仅是560万美元。这只是 OpenAI 和 Google 训练同等规模模型所花费费用的一小部分。
半导体业内人士表示,尽管DeepSeek在有限的资源下取得了令人瞩目的进展,但能否在产业中保持其竞争力依然是一个未知数。
来源:看中国
短网址: 版权所有,任何形式转载需本站授权许可。 严禁建立镜像网站.
【诚征荣誉会员】溪流能够汇成大海,小善可以成就大爱。我们向全球华人诚意征集万名荣誉会员:每位荣誉会员每年只需支付一份订阅费用,成为《看中国》网站的荣誉会员,就可以助力我们突破审查与封锁,向至少10000位中国大陆同胞奉上独立真实的关键资讯,在危难时刻向他们发出预警,救他们于大瘟疫与其它社会危难之中。