你在这里

谷歌DeepMind负责人称DeepSeek的成本说法“夸大其词”

谷歌旗下人工智能公司DeepMind首席执行官、2024年诺贝尔化学奖得主哈萨比斯(Demis Hassabis)在受访时称,中国人工智能初创公司DeepSeek花费不到600万美元就开发了其人工智能系统的说法“夸大其词,而且有点误导”。

DeepSeek上月发布了一款广受欢迎的聊天机器人和人工智能模型,其宣称的投入远远低于DeepMind和OpenAI等美国竞争对手,震惊了世界。哈萨比斯是谷歌公司人工智能部门的负责人,他向彭博电视表示,DeepSeek“似乎只报告了最后一轮训练的成本,而这只是总成本的一小部分”。

哈萨比斯还驳斥了DeepSeek的出现颠覆了人工智能开发背后的经济运作的观点。哈萨比斯周一在巴黎举行的人工智能行动峰会上说:“我们看不到任何新的银弹(非常有效的)技术”。他称,“DeepSeek并不是效率曲线上的离群值”。

DeepSeek公司据称花费了560万美元的计算成本,使用较旧的英伟达芯片来训练其模型。一些研究人员对这些说法提出了质疑。美国当局已开始调查DeepSeek是否通过新加坡中间商购买受限芯片来规避禁令。

彭博社日前报导称,OpenAI和微软正在调查一个与DeepSeek有关联的组织是否利用一种被称为“蒸馏”的过程从OpenAI获取数据。哈萨比斯说,DeepSeek似乎“依赖于一些西方模型进行蒸馏”,但没有提供具体细节。DeepSeek的代表没有立即回应置评请求。

DeepSeek模型推出引发股市动荡后,谷歌母公司Alphabet是坚持重大支出计划的几家硅谷巨头之一。上周,Alphabet公布了2025年750亿美元的资本支出计划。这些资金将用于云计算部门和Gemini等服务,Gemini是谷歌在搜索和其他产品中使用的人工智能模型。

哈萨比斯宣称:“从训练与性能或成本与性能的关系来看,Gemini比DeepSeek更有效率。我们只是没有过多地谈论它”。

法国人工智能初创公司Mistral AI的联合创始人门施(Arthur Mensch)则从DeepSeek的成功中看到了Mistral和欧洲技术希望的跳板。门施在接受政客新闻网欧洲版采访时说,DeepSeek是 “一家与我们非常相似的公司”。他甚至称DeepSeek为“中国的Mistral”。

门施表示:“他们(DeepSeek)的资金当然更充裕,但因为我们(存在的)年龄相仿,所以非常相似”。Mistral肩负着法国人工智能公司与美国竞争对手竞争的希望。该公司的融资额创下了欧洲初创企业的最高纪录:自2023年启动以来已超过10亿欧元,估值达60亿欧元。但与人工智能先锋企业——OpenAI、Anthropic和xAI相比,仍有很大差距,它们的融资额是Mistral的10倍甚至20倍。

这正是DeepSeek带来一线希望的地方,因为其R1模型可以与美国的领先模型相媲美,而成本和所用芯片据称却只有人工智能先驱OpenAI的一小部分。

门施谈到DeekSeek时说,“他们广泛使用了我们在2023年提供的技术”,指的是一种名为Sparse Mixture-of-Experts (MoE) 的机器学习技术。这种方法经过Mistral的改进,旨在降低预训练期间的计算成本。

门施说:“我们解释了如何训练它们,并提供了第一批模型。DeepSeek已扩大了规模”。Mistral现在打算从DeepSeek的创新中汲取灵感。门施表示,“他们采用科学的方法,通过找出不可行的方法来关闭大门。关闭这些门意味着为他人节省时间。我们很快就会提供一些东西”。

门施还认为,DeepSeek的出现证实了Mistral对开源模型的押注,这些模型也得到了Meta的支持,并与OpenAI形成了鲜明对比。门施说,人工智能业“在OpenAI的推动下,在2019年有些封闭,但现在又正重新开放。我们坚信,开源将取得胜利”。

栏目: 

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer