TL;DR:
在金融智能投顾对准确性、深度和合规性要求极高的背景下,通用大模型的幻觉和高成本问题日益凸显。北银金科提出的“大小模型协同”架构,通过将大模型用于意图理解与规划,小模型专精于精确计算,有效解决了这些核心挑战,为金融AI的信任构建与效率提升开辟了可行的商业化路径。
在人工智能浪潮席卷全球之际,大语言模型(LLM)的颠覆性潜力在各个领域引发了深刻变革。然而,当目光投向高度敏感且监管严格的金融智能投顾领域时,通用大模型的光环却蒙上了一层阴影:_幻觉风险、专业深度不足以及高昂的算力成本_成为其规模化落地的“阿喀琉斯之踵”。北银金科高级算法专家尹辰轩在AICon 2025北京站的分享,为这一困境提供了一种富有前瞻性的解决方案——“大小模型协同”架构,不仅是对技术栈的优化,更是对金融服务本质的一次“AI原生”的再创造。
“大小模型协同”:金融智能投顾的技术突破与范式重塑
传统智能投顾在过去十年间,主要依赖于基于规则引擎的“小模型”,如Black-Litterman或均值-方差模型,它们在资产配置和量化分析方面展现出精准性。然而,这些“黑箱”式模型缺乏人性化的交互能力,无法满足用户对个性化、持续性服务的需求,市场反响平平1。大模型的出现,似乎为弥补这一“顾问”短板带来了曙光,但其固有缺陷在金融业尤为致命。
技术原理解析:精准与通识的有机融合
北银金科的“大小模型协同”架构,正是针对大模型在金融领域面临的核心挑战而设计:
- 幻觉容忍度极低:在银行业务中,大模型1%的错误可能直接导致1%的不良率,这是不可接受的。相比C端99%的准确率已足矣,B端则必须逼近100%的确定性。
- 专业深度不足:通用大模型在面对复杂的量化投研任务时显得“稚拙”,难以生成可验证的专业结果。例如,要求其基于Black-Litterman模型生成基金组合,输出往往流于空泛。
- 高昂的算力成本与响应延迟:实测表明,全程使用大模型的回答时间可能长达40-50秒,且算力成本高企。通过提高小模型占比,响应时间可压缩至20秒以内,算力成本直接减半2。
为解决这些问题,该架构将任务明确分工:
- 大模型(如DeepSeek):承担“对话与规划”的核心职责。它通过Chain-of-Thought(思维链)进行用户Query的扩写与结构化意图识别,将口语、错别字等转换为带推理链的结构化意图。随后,任务规划Agent会根据识别出的意图,将任务拆解为子任务,并智能路由到最合适的小模型集群。此外,大模型还负责将小模型的量化结果“翻译”成用户易懂的语言,进行“达人融合”润色输出。
- 小模型集群:专注于“精确计算”,被压缩为五大类,覆盖95%的投研投顾需求:
- 基本模型:输出原子指标(如年化收益率)。
- 资产推荐模型:按资产维度(股票、债券等)挂载量化框架(基本面、技术、舆情),提供可追溯的推荐理由。
- 归因模型:实现OCR持仓分析、风险偏好评估,生成统一报告,甚至成为获客新抓手。
- 资产配置模型:内置Black-Litterman、Risk Parity等引擎,实时调用以生成组合。
- 分类预测模型:面向大类资产走势,实现可扩展的量化算法。 每个小模型都配有特征向量(算法名称、适用客群、输入规格、输出形式),实现可解释、可复现的精准调用,这正是金融领域合规性的基石。
创新的“二段交互”模式
尤为精妙的是,当大模型判断用户需要更深层操作时,不再输出长篇文字,而是直接推送交互式卡片。这些卡片背后是原有业务系统被解耦后的API,用户点击即可进入相关功能页面进行“二段交互”。这种方式将知识从“数据孤岛”中解放,以API形式按需注入对话流,使得旧有系统第一次以“AI原生”的方式被串联起来,既降低了训练成本,又提高了B端场景的准确率和用户体验。
重构信任与效率:商业价值与产业生态新动能
这一协同架构的商业价值不仅在于技术层面的创新,更在于其对金融服务产业生态的深远影响。它有效弥合了通用大模型与金融业务场景之间的鸿沟,为企业级AI的落地提供了切实可行的范本。
商业敏锐度:高效、合规与个性化的融合
- 显著的成本效益:通过将专业深度任务分派给小模型,大幅优化了“大模型的深度与算力比”3。通用大模型处理通用知识的成本可控,但一旦涉及投研专精的深度训练,成本将呈指数级增长。协同架构避免了这一陷阱,使得在相同专业度下,小模型实现的深度回答所需的算力远低于大模型内化知识的算力。
- 提升合规性与信任:在金融这一“信任产业”中,准确性和合规性是生命线。小模型的精确计算能力,有效降低了幻觉风险,保障了金融建议的专业性和可复现性,从而赢得了客户的信任。蚂蚁“蚂小财”在幻觉控制上的表现,以及同花顺“问财”在数据查询上的优势,均反映了市场对精准和合规的强烈需求。
- 赋能企业级数字化转型:该方案通过API串联旧有系统,解决了传统金融机构“烟囱林立”的痛点,将原本割裂的业务功能整合成统一的AI原生体验。这不仅是锦上添花,更是对业务流程的脱胎换骨,加速了企业级AI的落地进程。
- 拓展商业模式与服务边界:模拟“巴菲特投顾”、“格雷厄姆投顾”等角色,通过上传其文章策略并搭建相应模型,为用户提供多元化、个性化的服务,极大地丰富了智能投顾的产品线和用户体验。这种“达人融合”不仅带来新的增值服务,也可能形成新的用户群体和盈利点。
产业生态洞察:Agent与API驱动的未来
北银金科的实践印证了当前AI发展的一个核心趋势:LLM+API将成为大模型进入所有互联网生态的关键路径,而Agent在整个AI架构的商业实现上将扮演越来越重要的角色4。Agent的流程编排能力,使得大模型不必全知全能,只需理解意图并调用相应工具(API),这极大地降低了训练成本,提升了实际场景的准确率。
这一模式为金融行业带来了新的增长范式:传统量化投研的“深度算力”通过小模型得以保留和扩展,而大模型的“通识与交互算力”则赋予了金融服务前所未有的用户体验。
未来主义的金融愿景:人类与AI共治的财富管理
从哲学思辨的角度看,“大小模型协同”不仅是技术架构的优化,更是对人类与技术关系深层本质的探索。它体现了一种**“人类中心”与“机器高效”的和谐共存**,而非简单的替代。
技术对社会结构和工作方式的深层改变
- 顾问角色的演进:智能投顾不再是简单的“机器替代人”,而是成为“人的增强”。大模型提供的情绪理解、规划、融合能力,与小模型提供的专业计算、数据分析相结合,共同构建了一个更全面、更个性化的“超级顾问”。这使得传统投顾能够将重心转向更复杂的、需要人类智慧和共情能力的高级咨询服务。
- 金融服务的民主化与普及:通过AI降低专业金融服务的门槛,使得更广泛的大众能够获得过去只有高净值客户才能享受的个性化、深度分析和持续性复盘服务。这有助于缩小金融信息鸿沟,提升全民的财富管理水平。
- 信任的重塑:在自动化和AI介入的场景中,信任的建立至关重要。协同架构通过透明化小模型的算法(特征向量、可追溯的推荐理由)、以及明确的职责划分,增强了用户对AI建议的信任。然而,如何平衡大模型解释的易读性与小模型计算的严谨性,仍是需要持续关注的伦理挑战。
跨领域整合与未来图景展望
这种协同模式并非金融专属,其核心思想——“通用大模型负责理解与规划,专用小模型负责精确执行”——预示着Agent+API的架构将成为未来所有复杂业务场景的通用范式。无论是医疗诊断、法律咨询还是工业控制,都将受益于这种将大模型的认知泛化能力与专用领域知识模型深度结合的策略。
未来3-5年内,我们可以预见,金融机构将进一步深化这种协同架构,打造更为细致和多样化的专业小模型。同时,随着Agent技术的成熟,其任务规划、工具调用和结果融合能力将更加智能化、自适应。AI投顾将不仅仅是提供投资建议,更可能演变为一个拥有持续学习能力、能预测市场情绪、甚至在用户授权下自主执行交易的“金融大脑”。届时,人类将更多地扮演策略制定者、风险控制者和伦理监督者的角色,与AI共同步入一个更加智能、高效且富有想象力的财富管理新时代。