中國人工智能公司DeepSeek推出的新AI模型引起了矽谷的關注。(圖片來源:STR/AFP via Getty Images)
【看中國2025年1月27日訊】(看中國記者聞天清編譯/綜合報導)中國一家鮮為人知的人工智能(AI)公司DeepSeek(全稱:杭州深度求索人工智能基礎技術研究有限公司)發布了人工智能模型,並宣稱儘管成本更低、芯片性能更低,但其性能卻超越美國最好的AI模型,這令整個矽谷感到震撼。
DeepSeek新AI模型震撼美國矽谷
美國消費者新聞與商業頻道(CNBC)報導,這個名為DeepSeek的中國人工智能公司在去年12底推出了一個免費的開源大型AI語言模型DeepSeek-V3。據稱,在使用了英偉達(Nvidia)的低性能芯片H800s的情況下,這個AI模型僅用了2個月的時間完成構建,其成本不到600萬美元。
DeepSeek的AI新模型,引發了外界對華盛頓在人工智能領域的全球領先優勢是否正在縮小的擔憂,並對大型科技公司在建立人工智能模型和資料中心方面的巨額投入提出了質疑。
在一系列第三方基準測試中,在從複雜問題解決到數學和編碼的準確度方面,DeepSeek新AI模型均名列前茅,其整體表現表現優於Meta(臉書、Instagram和Threads母公司)的Llama 3.1、OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5。
1月20日,DeepSeek發布了其AI推理模型DeepSeek-R1,該模型在許多第三方測試中的表現也優於OpenAI最新模型o1。
微軟首席執行官(CEO)薩蒂亞·納德拉(Satya Nadella)在世界人工智能大會上表示:「DeepSeek的新模型非常令人印象深刻,他們不僅有效地開發了一個開源模型,實現了推理時間計算,而且計算效率極高。我們應該非常、非常認真地對待中國(AI)的發展。」
在美國政府對北京當局實施嚴格半導體限制措施的情況下,這使得中國無法獲得英偉達的H100等性能最強的芯片。最新AI模型的進展顯示,DeepSeek要么找到了規避美國芯片禁令的方法,要么華盛頓出口管制並非那麼嚴格。
在接受媒體採訪時,Benchmark普通合夥人Chetan Puttagunta表示:「他們可以採用一個非常好的大型模型,並使用一種稱為蒸餾(distillation)的方法。基本上,你使用一個非常大的模型來幫助你的小模型在你想要它變得聰明的事情上變得聰明。這實際上是非常划算的。」
外界對於中國人工智能公司DeepSeek及其創始人梁文峰(Liang Wenfeng)知之甚少。根據媒體報道,DeepSeek是由一家名為「幻方量化」(High-Flyer)的中國對沖基金創建的,該基金管理約80億美元的資產。
然而,DeepSeek並非唯一一家取得AI模型進展的中國公司。
領先的人工智能專家李開復表示,他的新創公司AI模型「零一萬物」(01.AI)僅花費了300萬美元。
1月22日,社交媒體抖音(TikTok)母公司「字節跳動」(ByteDance)發布了其模型的更新,聲稱在一項關鍵基準測試中超越了OpenAI的模型o1。
Perplexity首席執行官Aravind Srinivas說:「需求是發明之母。因為他們必須找到解決辦法,所以他們最終建造了更有效率的產品。」
Meta首席AI專家:DeepSeek進展顯示開源模型正超越專有模型
Business Insider報導,在發布新AI模型DeepSeek-R1之後,中國開源人工智能公司DeepSeek的快速崛起引起了矽谷的關注。在第三方基準測試中,其表現優於OpenAI、Meta、Anthropic等美國領先的人工智能公司。
Meta首席人工智能專家 Yann LeCun認為,DeepSeek成功的最大收穫不是來自中國競爭對手的加劇威脅,而是保持人工智能模式開源的價值,以便任何人都能受益。
LeCun在社交媒體Threads 上一篇帖文中表示,這並代表中國的人工智能水平「超越了美國」,而是AI的「開源模型正在超越專有模型」。DeepSeek「受益於開放研究和開源」,這就是開放研究和開源的力量。
DeepSeek R1本身是開源的AI模型,Meta的Llama也同樣是開源模型。 OpenAI最初成立時是一家開源人工智能公司,但最近已轉向閉源。
1月20日,DeepSeek在發布AI新模型DeepSeek-R1時稱,其「展示了卓越的推理能力」,它正在「突破開源AI的界限」。
DeepSeek宣布這一消息數日后,Meta首席執行官馬克·扎克伯格(Mark Zuckerberg )宣布,該公司計畫2025年在人工智能領域投資超過600億美元。扎克伯格一直倡導AI開源模式。
支持AI開源模型的人表示,由於任何人都可以修改和重新分發程序編碼,開源模型可以讓科技快速、民主地發展。另一方面,閉源模型的支持者認為它們更安全,因為程序編碼是保密的。
拜登芯片禁令難阻北京高科技雄心
《金融時報》報導,儘管拜登的芯片禁令試圖阻止北京高科技雄心,掌管對沖基金的中國億萬富翁梁文峰創建的DeepSeek在財務預算緊張的情況下依然建造AI新模型DeepSeek R1。
在美國政府禁止英偉達向中國出口其性能最強的芯片後,中國人工智能公司被迫尋找創新的方法來最大限度地發揮有限數量芯片的運算能力,很顯然,而梁文峰旗下的DeepSeek已經掌握了解決這個問題的方法。
在接受媒體採訪時,一位接近DeepSeek的人工智能研究人員說:「DeepSeek工程師知道如何充分發揮這些GPU的潛力,即使它們不是最高端的科技產品。」
業內人士表示,DeepSeek 專注於研究,這使其成為一個危險的競爭對手,因為它願意分享其突破,而不是為了商業利益而保護它們。 DeepSeek 尚未從外部基金籌集資金,也沒有採取重大措施將其模式貨幣化。
北京一位人工智能投資者稱:「DeepSeek的運作方式與 DeepMind早期的營運方式相似。」 主要專注於AI的研發和相關人工智能項目。
DeepSeek和High-Flyer 尚未回應置評請求。
根據DeepSeek發布的聲明稱,這個包含 6,710 億個參數的新AI模型只使用了 2048 塊英偉達H800芯片,成本費用僅是560萬美元。這只是 OpenAI 和 Google 訓練同等規模模型所花費費用的一小部分。
半導體業內人士表示,儘管DeepSeek在有限的資源下取得了令人矚目的進展,但能否在產業中保持其競爭力依然是一個未知數。
来源:看中國
短网址: 版權所有,任何形式轉載需本站授權許可。 嚴禁建立鏡像網站。
【誠徵榮譽會員】溪流能夠匯成大海,小善可以成就大愛。我們向全球華人誠意徵集萬名榮譽會員:每位榮譽會員每年只需支付一份訂閱費用,成為《看中國》網站的榮譽會員,就可以助力我們突破審查與封鎖,向至少10000位中國大陸同胞奉上獨立真實的關鍵資訊, 在危難時刻向他們發出預警,救他們於大瘟疫與其它社會危難之中。