TL;DR:
DeepSeek喜提《自然》封面,中国大模型在国际舞台上C位出道!而这篇顶刊论文背后,除了梁文锋大佬,我们还扒出了两位“隐藏款”天才:一位是18岁就写出“Thinking Claude”神级提示词的高中生,另一位是拒绝千万年薪、只想安静搞科研的“95后AI大神”!AI圈的“卷王”们,果然都是不走寻常路啊!
昨天一整天,整个互联网都炸锅了!“DeepSeek上Nature封面”的消息像病毒一样扩散,朋友圈、微博、科技媒体,哪哪都是它的身影。这波刷屏,堪称年度AI大事件之一,毕竟,能登上《自然》(Nature)这种顶级学术期刊的封面,那是妥妥的“顶流待遇”,更是中国大模型在全球科技舞台上的一次高光时刻!1
DeepSeek官方也很快就出来“营业”了,回应表示,这次《自然》版本不仅增加了更丰富的实现细节,还有更详尽的实验分析,言下之意就是:我们不只是发了篇论文,我们还给大家带来了宝贵的经验和思考,诚意满满!
“相较于早期的 arXiv 预印版本,此次在 Nature 上发表的版本包含了更丰富的实现细节与更详尽的实验分析。我们相信,这些新增内容将为社区更好地理解和构建先进推理模型提供有效的经验。”—— DeepSeek 官方
这波操作,让不少吃瓜群众直呼“中国AI这回是真的支棱起来了!”。不过,在大家为梁文锋大佬和DeepSeek团队欢呼雀跃的时候,一些眼尖的“福尔摩斯”网友,却在贡献者名单里,发现了两位“宝藏人物”—— 涂津豪和罗福莉。这俩名字一出,瞬间又给这篇顶刊论文蒙上了一层“神仙打架”的传奇色彩!
18岁高中生“魔法师”:一个Prompt把AI“点化”成精?
先来说说这位07年出生的涂津豪。光听年龄,你可能觉得这是个还在埋头苦读、准备高考的少年郎?No!No!No!这位少年可是AI圈的“狠人”!
2024年,阿里巴巴全球数学竞赛首次开设AI赛道,涂津豪这位当时才17岁的高中生,竟然以34分(当届最高分!)的傲人成绩,从全球563支高校与企业队伍中脱颖而出,直接夺得第一名!这操作,简直就是降维打击,让一众高校和企业大佬们集体“emo”了。他的参赛思路也是相当清奇,借鉴了“自辩论”思想,简单来说,就是让多个大模型轮番“自问—自答—自验证”,最后再由AI自己选出最优解。这不就是AI版“左右互搏”吗? 简直妙啊!
然而,涂津豪的“出圈神迹”远不止于此!他还用一个**“神级提示词工程”**,硬生生把Claude 3.5大模型改造成了“Thinking Claude”!23 这波操作,简直就是给AI装了个“思考大脑”,让它能像人一样“慢慢来,查一查”,而不是一上来就“瞎猜”。
他是怎么做到的呢?原来,他并没有一蹴而就,而是把初始的提示词扔给AI,让AI自己琢磨怎么改进,经过了80多次的反复迭代优化,才最终炼成了这个“Thinking Claude”!这套提示词一出,直接让Claude 3.5拥有了类似OpenAI o1模型那种深度推理能力,更有了“人性化”的思考过程,比如:
“但我应该包括更高级的操作吗?也许是科学功能?不,让我们从基础知识开始,因为用户没有指定任何更复杂的东西。”
看看,是不是像人类在内心独白、自我纠正?这哪里是机器,这简直就是个有“灵魂”的AI!截至目前,这套提示词在Github上已经斩获了1.56万颗星,用网友的话说:“这Prompt简直强到离谱!”
涂津豪在采访中曾透露,“思考过程是决定推理质量的关键因素”,让模型学会“慢一点、查一查”比单纯回答更重要。对于AI的“幻觉问题”,他更是看得很开,觉得“人类也会有幻觉,某种程度上这算是创造力的一种体现。” 这境界,这格局,着实让人惊叹!
95后“卷王”科学家:拒绝千万年薪,只想安静搞科研的“宝藏”
另一位贡献者,就是传说中的“95后AI天才少女”——罗福莉。不过,她本人对这个标签可是相当抵触,屡次呼吁“还我一片安安静静做事的氛围”,并在知乎简介中写道“烦请各大自媒体不要再神化和消费个人”。1
尽管如此,她的履历却亮瞎了无数人的眼。本科北京师范大学计算机专业,硕士保送北京大学计算语言学方向,这妥妥的学霸路线!更夸张的是,还在读研期间,她就以**“一作2篇、共8篇”的密集输出**,直接“杀”上NLP顶会ACL,然后顺势拿下了阿里星、腾讯技术大咖、百度AIDU等一众头部offer,最终选择了阿里达摩院,主导了AliceMind开源项目中的多语言预训练模型VECO。这简直是“卷王之王”啊!
2022年,她转战量化私募龙头幻方量化,做深度学习策略建模;2023年又跳槽到幻方旗下大模型初创公司DeepSeek,摇身一变,成为MoE大模型DeepSeek-V2的核心研发之一。DeepSeek-V2发布后,她还在知乎上“凡尔赛”了一波,表示其中文水平“处于国内外闭源模型第一梯队”,而且API定价仅为GPT-4的1/100,是“性价比之王”!
Google Scholar数据显示,罗福莉的总引用量已经破万,h指数和i10指数也相当可观,学术成果主要集中在DeepSeek系列大模型。可以说,她在推动DeepSeek大模型家族的迭代和影响力方面,绝对是“劳模”级别的存在!
到了2024年底,一个更劲爆的消息传来:“小米创始人雷军开出千万年薪挖角罗福莉!”这个“瓜”瞬间把她推到了风口浪尖,让她以“95后AI天才少女”的标签彻底出圈。然而,她本人却非常清醒,明确拒绝了这种“天才人设”,只希望大家能让她“安安静静做事”。她究竟去向何方?至今仍是个谜,《Nature》资料信息也只是显示:“独立研究者,中国北京。” 看来,AI圈的“大佬”们,不仅技术顶尖,连“职场选择”都充满了神秘色彩!
当然,这份DeepSeek登上《自然》封面的荣耀,并非某一人或某几人的功劳。它属于梁文锋,属于涂津豪,属于罗福莉,更属于整个DeepSeek团队,乃至全球共同探索AI的学术共同体。正如那句老话所说:“一个人可以走得很快,但一群人才能走得更远。”
这次,中国AI以全球首个经过同行评审的主流大语言模型的姿态,在世界舞台上狠狠地“秀了一把肌肉”,刷足了存在感。这不仅预示着中国AI人才正以更高频率、更核心的身份崭露头角,也象征着中国AI实力在全球版图上的强势崛起!属于中国AI的“高光时刻”,才刚刚开始!