
两年前,当百度和阿里巴巴等知名中国科技公司通过发布夺人眼球的公告和新聊天机器人来追赶硅谷在人工智能领域的进展时,DeepSeek采取了不同的做法。它专注于研究。
这个策略奏效了。
这家中国初创公司称,它创建了一个功能强大的人工智能模型,其构建成本大大低于资金雄厚的美国竞争对手的产品,这一消息震惊了整个科技界。
在中美两国争夺人工智能主导权的竞争中,DeepSeek似乎横空出世。事实上,它近年来在中国科技界一飞冲天,走的完全不是传统路数。
DeepSeek的研究使命与OpenAI等公司相似,OpenAI在2022年秋季为美国在人工智能领域做出了标志性的贡献。不过,它们的相似之处大多仅止于此。
DeepSeek起源于金融,并非为发展技术本身而做技术。它的母公司是一家名为幻方的中国对冲基金,起初并不是一家像OpenAI那样致力于保护人类免受人工智能侵害的实验室,而是一家利用人工智能在中国股市下注的企业。
中国的散户投资者以冲动进出股市而闻名,幻方正是抓住了这一市场的机遇,得以蓬勃发展。2021年,幻方发现自己受到了中国监管机构打击投机的压力,政府认为这有悖于保持市场平稳的努力。
因此,幻方开始寻求一个新的机会,它认为这个机会更符合中国政府的优先事项:先进的人工智能。
“我们主要做的科技方向——只是大家习惯把我们局限在投资领域,AGI有大得多的用处和大得多的价值,”2023年,幻方首席执行官陆政哲对中国官方媒体说。“我们独立于投资新成立了一个团队,相当于二次创业。”
DeepSeek应运而生。与其他许多中国初创企业一样,它以不同的商业模式进入了一个成熟的市场。
据信,DeepSeek的最新人工智能模型几乎与美国竞争对手一样强大,但效率却高得多。它的成功表明,硅谷在人工智能领域的领先优势已经缩小。尽管华盛顿努力限制中国获得人工智能所需的先进芯片,但DeepSeek的突破还是让人怀疑这些控制措施是否长期有效——尽管DeepSeek的创始人承认芯片限制是一个问题。
DeepSeek并没有依靠生产面向消费者的人工智能产品来获取收入,直到本月才发布了第一个聊天机器人,任何人都可以通过简单的命令生成文字和照片。实际上,该公司利用幻方从股票交易中赚到的钱来资助雄心勃勃的研究。这种做法使它有别于美国的竞争对手,因为它们从根本上都是消费技术公司。
这种非常规方法也让DeepSeek得以避开中国政府对公众使用的人工智能的严格监管。由于该公司专注于研究,并向使用其模型的企业销售产品,而在本月发布聊天机器人之前,并不面向消费者应用,因此其早期工作并未引发同样的政府限制。
DeepSeek的首席执行官梁文锋是一位戴眼镜的清瘦工程师,曾就读位于杭州的浙江大学。他在接受中国媒体的几次采访中反复表示,要赶上美国的创新步伐,中国公司必须把研究放在利润之前。DeepSeek和幻方都没有回应置评请求。
梁文锋在接受中国科技媒体36氪的一次广为流传的采访时说,中国科技公司“缺的不是资本,而是缺乏信心以及不知道怎么组织高密度的人才”。
根据采访和公开报道,与梁文锋共事过的人都认为他是一位有能力、有深厚技术背景的管理者。
曾参与DeepSeek早期模型开发的计算机工程师王子涵(音)说:“他绝对是个INTP,”他指的是迈尔斯·布里格斯测试中的一种内省型人格类型,这是一种在中国年轻人中很流行的人格测试。“INTP是很好的研究者,他们喜欢探索,”王子涵说。“他不是那种想控制一切的人。”
他说,梁文锋不太在意项目时间表等细节,偶尔会向整个研究团队提出一些发人深省的研究问题。但最主要的是,梁文锋似乎以推动技术进步为动力,并不注重利润。
许多中国公司倾向于招聘程序员,梁文锋与他们不同,他出了名地会聘用计算机领域以外的人才。DeepSeek的员工中有来自中国顶尖大学的诗人和人文学科专业的学生,他们训练模型编写中国古典诗词,并解答中国难度很大的高考题。