文/白杨

  过去一年,是大模型狂奔的一年,各类基础模型百花齐放,各类榜单成绩也被不断刷新。但是,通用大模型距离产业仍然遥远,如何让大模型真正落地应用,整个行业一直在摸索。

  而行业大模型,已被公认为是衔接通用大模型与产业的最佳形式之一。12月14日,火山引擎携手智谱AI共同发布了高性能金融大模型(以下简称:火山-智谱金融大模型),这也让大模型的真正落地应用又向前迈出一步。

  今年初,很多业内人士在探讨大模型落地方向时,都不约而同地提到了金融行业。这是因为金融行业属于信息密集型行业,数字化起步比较早,沉淀了大量高质量数据,而且其前中后台都有广泛的降本增效空间。

  事实也证明,在拥抱大模型方面,金融行业确实拥有更高的积极性。IDC早前的一项调研结果显示,样本中超过半数的金融机构计划在2023年在生成式人工智能技术上进行投入,只有10%的金融机构表示,他们目前没有试验计划。

  在金融行业,大模型拥有很广泛的应用场景,不过现阶段最容易实现的场景是用户体验、知识管理和应用开发等,包括智能投顾、自动化客服、风险评估、报告自动化生成、代码生成应用等。

  然而,虽然大模型在金融行业有着巨大的前景,但金融作为监管最为严格的行业之一,其对数据安全和隐私有极高的要求,所以在推动大模型落地金融行业的过程中,如何做到安全、合规也是技术提供商必须回答的问题。

  火山引擎总裁谭待便表示,“金融业具备大模型应用的天然土壤,同时在风控、安全、效率等方面有严格的要求,所以,金融机构需要的大模型将是一个技术和行业交叉融合的系统化工程。”

  强底座+强服务推出金融大模型

  在合作打造火山-智谱金融大模型时,火山引擎和智谱AI分工明确,后者负责提供基础底座大模型,前者负责大模型平滑落地。

  智谱AI是中国较早投入大模型研究的企业之一,其在2020年就研发了GLM 预训练架构并开始训练百亿参数模型。2021年,智谱AI成功训练出万亿级别稀疏模型,2022年,其进一步推出高精度开源千亿模型 GLM-130B型。2023年2月,智谱AI研发了ChatGLM,该模型是基于 GLM-130B 持续进行文本和代码预训练而来,并通过有监督微调等技术实现了人类意图对齐。

  而火山-智谱金融大模型的底座就是智谱AI于今年10月刚刚发布的ChatGLM3大模型,相比前几代产品,ChatGLM3在模型性能、功能及底层架构均完成了全方位升级。

  据悉,在44个中英文公开数据集测试中,ChatGLM3在国内同尺寸模型中排名首位。其Agent智能体率先开启国产大模型原生支持工具调用、代码执行、数据库操作、知识图谱搜索与推理、操作系统等复杂场景能力,智能规划和执行能力比二代提高1000%。此外,ChatGLM3还通过采用最新的高效动态推理和显存优化技术,实现推理速度提升2-3倍,且成本降低1倍。

  火山引擎则为ChatGLM3大模型的落地提供了工程化解决方案。具体包括解决稳定性、性能优化、推理加速等算力挑战的轻量级模型训练方案;可同时适配国内外硬件生态,以及满足金融机构自主创新需求的私有化或者云端部署方案;能确保数据安全和模型产出合规有效的安全架构和内容安全方案;帮助金融机构缩短落地周期,更高效地开发出适用于自身企业大模型应用的大模型工具链和多场景落地方案。

  今年6月,火山引擎正式发布大模型服务平台“火山方舟”。当时,谭待就强调,火山引擎提供的不是模型能力,而是帮助应用方更好使用模型的能力。这些能力既包括模型试用、评测、接入、精调等,也包括训推一体、弹性调度、算子优化等。

  对于双方的合作,智谱AI CEO 张鹏也表示,智谱AI专注于做大模型的中国创新,火山引擎则具备高效的算力基础设施、开放安全的大模型生态、丰富的金融行业实践以及完善的交付保障。通过双方优势互补,可以加速大模型的行业化落地。

  助力金融行业提效

  此前,通过对传统AI技术的引入,已经打破了金融行业存在的流程复杂、周期较长、工作单一且重复、审批方式以及流程耗费时间长等问题。

  但是有研究指出,传统AI技术依然存在弊端,比如无论是预先设定业务流程,还是结构化数据提炼要求,传统AI技术都需大量专业人员参与,导致工作量大且专业性要求高,且对AI深度学习训练的成效,往往只能在事后进行分析调整。

  而大模型技术可以将众多非结构化数据融入于相对便捷的特征工程,所以大模型技术不但可以大幅简化专业人员工作量,还能提供事前、事中的效果评测与及时调整优化,让金融场景的AI服务效率进一步提升。

  比如基于大模型,金融企业可以利用机器学习算法进行数据分析,根据客户的风险状况进行准确评估,从而实现贷款审批流程的自动化,确保贷款的准确性和效率。以及借助大模型技术,金融机构还可以实时监测交易和市场波动,从而及时制定策略。

  所以,大模型在金融行业的应用具有很大的想象空间。据悉,经过海量金融数据集精调打造,火山-智谱金融大模型已具备金融领域的常识知识和认知能力。测试显示,火山-智谱金融大模型在自动生成代码、自动解读研报、智能客服、智能助理、智能数据分析等行业场景已有良好表现。

  未来,选择由大模型企业和云厂商合作打造的行业模型,或许会成为企业落地大模型的主要方向。因为对企业而言,光选个好模型还不够,还需要让模型能力落地。像火山引擎等云厂商推出的MaaS(Model-as-a-Service)服务,实际上就是为企业提供了大模型使用的一站式工作台。

  更重要的是,未来企业应用的大模型也不会只有一个,而是多模型。所以,企业需要借助火山方舟这样的平台,来同时接入使用多个模型产品,进而节省大量时间和精力,投入到更核心的业务场景当中。