TL;DR:
同样是“教AI做人”,有人日薪100块画框框,有人月薪6.5万定规则。AI自动标注正在疯狂吞噬底层岗位,但专家级标注师反而成了香饽饽。一句话:要么升级成AI训练师,要么等着被AI取代。
早上九点,小林戴上耳机,打开标注平台。耳朵里传来一段带四川口音的普通话——她要在几分钟内逐字转写、标出发音偏差、判断AI的识别结果哪里跑偏。外人看来她好像在摸鱼听播客,可这就是她的全职工作。官方title叫“数据标注员”,但她更愿意叫自己“AI训练师”——毕竟,听起来比“人肉电池”酷多了。但一旦有人追问具体做什么,她通常会沉默两秒,然后答:“就……教AI听人话。”
就这么一句轻飘飘的回答背后,藏着一个工资从2000到65000元、横跨三十倍的魔幻行业。
AI背后的“人肉电池”:月薪2K与65K的差距从哪来?
我们抓了Boss直聘上北京302个“数据标注”岗,拆了151份完整JD。月薪中位数10500元,最低2K,最高65K——首尾相差三十多倍。1
低薪那头的岗位长这样:“数据标注,双休,小白可做”,学历经验不限,日薪185元,月薪4-5K。这就是传说中的“人肉电池岗”:面对电脑,机械地点鼠标,日复一日地画框、打标签。而高薪端的画风完全不同:百度给自动驾驶数据标注算法实习生开出500-600元/天,要求硕士;阿里巴巴的AI训练师岗20-35K、16薪,同样卡硕士。1
同一个“标注”俩字,身价差十倍。区别在于:低薪端是执行——按要求标、按SOP做;高薪端是定义——定标注规则、管质量标准、打通算法和数据的闭环。 前者可替代,后者难复制。
一位在标注行业干了六年的老兵说得直白:“2016年,标注员是手艺人,熟手吃香;现在,标注员是流水线工人,谁都能干,你就是个账号。”1
从“画框”到“拿主意”:你到底是AI的保姆还是导师?
我们把这151份JD按模态一拆,发现工作内容早已不是简单的“拉框”了:
- 文本标注(16%):语料清洗、对话质量评估、多语言翻译校对。大模型时代需求暴增——腾讯甚至招“大模型数据标注-代码方向”,你得看懂AI写的程序,判断哪里有bug。1
- 图像和视频标注(17%):框选、描点、分割、关键点标注。某大型车企的“智驾数据标注算法工程师”岗,要求处理4D点云和LiDAR数据,月薪40-70K、15薪。这哪儿是“画框”?这分明是传感器专家级操作。1
- 语音和音频标注(1%):占比最低,要求却高得离谱。今年6月,马斯克的xAI面向全球招中文AI导师,训练Grok的中文语音能力,要求母语级中文、熟悉方言和地域口音差异,美国境内时薪35-45美元。1
- 多模态和综合标注(36%):占比最大,一个岗位同时涉及图文音视频。单一技能的可替代性越来越高,全能选手更吃香。1
更扎心的是专业门槛。医疗标注要临床医学背景;金融标注要金融经济专业;具身智能标注指向机械和自动化。1 离数据价值链的上游越近,你需要的就不仅仅是耐心,而是实打实的领域知识。
大厂定规则,外包拆包,底层标注员正在被AI“反噬”
行业逻辑很清晰,看招聘公司就知道了:京东、腾讯、阿里、快手、小红书、百度这些大厂招人并不是最多的。最多的是海天瑞声、云测数据、倍赛科技这些标注外包商。1
大厂负责定标注规则和评测标准,外包公司拆成细碎SOP再层层分包。 许多标注员觉得工作机械、看不到全貌,原因就在这里——他们站在流水线末端,手里只有一个账号和一套指令。
但更残酷的现实是:AI开始“反噬”自己了。
GPT-3论文证明了大模型的少样本学习能力,模型不再需要海量人工标注。同时自动标注技术成熟、合成数据崛起,行业自动化率从三年前的约30%飙到60%以上。1 现在的主流工作流是“自动标注+人工复核”:AI先粗标一版,人负责质检、纠错、补齐边界案例。
这导致了一道清晰的剪刀差:2024年,80%的投资流向自动标注公司,传统劳动密集型标注企业拿到的融资不到5%;基础标注用工在收缩,但懂医学、法律、金融的专家级标注师却持续紧缺。1
一位AI公司HR说得更直接:“AI训练师的薪资是标注员的3-5倍,但我们几乎不会从标注员里招训练师,宁愿招刚毕业的计算机系学生从头带。”1
数据标注的过去、现在和未来:谁会被留下?
回顾历史,数据标注经历了四个阶段:
- 2006—2014(前标注时代):李飞飞搞ImageNet,最初以10美元时薪雇本科生逐张标图,结果学生很快受不了。转型靠Amazon Mechanical Turk,来自167个国家的近5万名众包工人完成了超过1400万张图片的标注。当时学术界把做标注当“搬砖”。1
- 2014—2017(标注工厂时代):第一批数据标注公司成立,选址三线城市。理由很现实:人力便宜、租金便宜、有补贴。“我们就是在吃人口红利,”一位标注公司老板直言,“开在北京一个月4000招不到人,开到县城2000就有人抢着干。”大量农村青年、小镇宝妈、残障人士经培训成了标注员。但他们大多不知道自己在做什么:“每天就是拉框拉框拉框,这些框拿去干嘛,没人告诉我们。”1
- 2017—2020(分化升级):大厂入场,标准化和分层开始。底层仍是基础框选,往上是质检员,再往上是标注规则师——要懂AI基本原理,收入翻好几倍。2020年初,人社部正式将“人工智能训练师”纳入国家职业分类目录。2
- 2020至今(AI反噬):自动标注+RLHF崛起。RLHF催生出提示词工程师、AI对齐训练师——技能门槛完全不同。基础重复性标注确实在被吞噬,但“这版标得好不好”“边界案例怎么处理”“这段画面美感够不够”,这类需主观判断和领域经验的环节,仍得人来兜底。
那么,数据标注员还有未来吗?
国家数据局的优秀案例显示,人机协同正在成为主流:智能标注平台通过图像分割、OCR等预标注技术,效率提升60%;质检通过率提升至98%。3 同时,产教融合模式正在培养新一代人才,与20余所高校合作开发课程,年输送标注工程师超200人。3
但AI训练师的成长路径已经很明确:
- 阶段1:学习Python、Pandas、SQL,参加在线课程
- 阶段2:掌握NLP/计算机视觉工具(spaCy、Hugging Face、YOLO、SAM)
- 阶段3:进阶到AI训练师岗位,年薪15-50万人民币
- 终极:AI数据科学家,年薪50-80万人民币4
回到开头的小林,她告诉我们,现在她不只做语音转写。每天要开团队对齐会,争论方言口音的标注边界该划在哪儿;要写质检报告,分析语音模型在哪几个声调上最容易翻车;偶尔被拉去和算法工程师开会,凭听感给语料提改进意见。1
这一行变得太快了。 去年还在标文本对话,今年改标语音语调,明年也许要标机器人的动作数据。数据标注依然会是AI不可或缺的人类底座,只不过接下来它注定会把被替代的人和不会被替代的人分到越来越远的两端。
引用
-
深扒151份JD,揭秘“数据标注员”:两极分化,30倍薪水差,残酷的未来 (2026/6/8) · 硅星人Pro · 作者:樊雅婷,36氪经授权发布 · 检索日期2026/6/8 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
-
数据标注师:化“人工”为“智能” (2023/8/22) · 中国青年报 · 作者:高蕾 · 检索日期2026/6/8 ↩︎
-
数据标注优秀案例集之四十 | 建设人工智能数据标注实训基地,打造人才培养高地 (2025/6/12) · 国家数据局 · 检索日期2026/6/8 ↩︎ ↩︎
-
人工智能训练师的职业画像和数据标注员的岗位认知 · openvela · 作者:邝煜云 · 检索日期2026/6/8 ↩︎