斯坦福华裔科学家 50刀训练出媲美Deepseek模型

来源:21世纪经济报道 作者: 日期:2025-02-09

据《科创板日报》消息,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。

该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini2.0 Flash Thinking Experimental提炼出来的。

公开资料显示,李飞飞1976年生于北京的一个高级知识分子家庭,16岁时赴美求学。从2000年进入加州理工学院攻读研究生起,李飞飞一直从事人工智能研究,并于2005年获得电子工程博士学位。

她在33岁时就成为斯坦福计算机系终身教授,44岁成为美国国家工程院院士。在计算机视觉这一领域还相当冷门的早期,李飞飞就选择了这个方向并持续耕耘,创立了ImageNet——一个拥有1500万张图片的数据库,成为人工智能计算机视觉研究的奠基之作。

据《证券时报》报道,李飞飞于2024年4月创办了WorldLabs(空间智能),正式从学者转型成为一名创业者。创办仅几个月,空间智能已在7月的一轮融资中筹集到了约1亿美元资金,估值突破10亿美元,晋升为又一AI独角兽。

据澎湃新闻报道,李飞飞曾在采访中提到,现在的AI比人类差远了,能耗高、体积庞大,而且尚未具备情感,但人类智慧可以启发下一代AI做得更好。

    A+
声明:本文转载自其它媒体,转载目的在于传递更多信息,并不代表赞同其观点和对其真实性负责。