您现在的位置是：首页 > 人工智能人工智能

平安科技前沿技术部门负责人王磊：大规模预训练模型在垂直领域应用的缺陷与改进

cc博主2022-01-24【人工智能】527人已围观

平安科技前沿技术部门负责人王磊：大规模预训练模型在垂直领域应用的缺陷与改进第1张

作者 | 王磊

整理 | 维克多

编辑 | 青暮目前，大规模预训练模型已经在自然语言处理领域取得了巨大的成功。BERT、GPT-3等大规模预训练模型被看做是“暴力美学”的一次胜利，验证了“模型越大，性能越好”的逻辑，业界也普遍形成了“炼大模型”的竞赛趋势，国内研究机构和企业也相继发布了大规模预训练模型，呈现百花齐放、百家争鸣的发展格局。

这些模型的实际应用情况如何？它们能解决哪些实际问题？还有哪些不足？

2021年12月，平安科技前沿技术部门负责人王磊在 CNCC 2021“产业共话：大型预训练模型的商业应用及技术发展方向”论坛上，做了《大规模预训练模型金融领域应用中面临的主要问题与应对技术探讨》的报告。在报告中，他指出了当前大规模预训练模型在垂直领域的“致命”问题，针对这些问题提出了平安科技的解决方案。

例如，他认为大规模预训练模型在垂直领域性能达不到要求的原因可能是：“大规模预训练模型的训练语料库规模很大，既包含了该领域的关键信息也包含了其他无关信息，使得模型缺少对关键信息的关注”，“当前大规模预训练模型的机制改进也也很少涉及对关键信息的提取”。

基于此，王磊认为，大规模预训练模型本质上都是在处理信号，但只要是信号，就可能进行分解，将背景信息和垂直领域的信息分离开来，从而有效贴合下游场景。

另外，金融客户对上线模型的精度要求很高，不少场景直接使用预加载模型往往很难满足需求。王磊提出置信度评估方法，利用强化学习和Bagging思想评估模型靠谱程度。

以下是演讲全文，AI科技评论做了不改变原意的整理。

本次分享的主题是《大规模预训练模型金融领域应用中面临的主要问题与应对技术探讨》，主要以中国平安为案例，从问题背景、语义空间分解技术、置信度评估方法以及应用等几个方面介绍。

1
问题背景

在平安公司场景下，大规模预训练模型在金融业务上的应用主要集中在贷款风控与股市投资。同时，这两个领域近些年的建模在因子层面会比较依赖大数据，例如文本信息，使用预训练模型进行处理能够形成一些特征因子，从而方便分析理解。

大规模预训练模型已经在几十个任务上刷榜，在医疗领域的表现更是令人瞠目结舌。但是深入到金融领域，其性能仍然无法满足要求。以选股为例，传统方法在信息获取阶段会人工从研报、雪球、知乎等论坛找寻一家公司的信息以及风评，然后结合基金经理或投资人自己的判断获得对这家公司的洞察，从而决定是否买进。

由于金融领域的容错性特别低，而且要求模型对专业知识有很深的理解。如果达不到一定的理解水平，从业者宁可不用AI模型。

平安科技前沿技术部门负责人王磊：大规模预训练模型在垂直领域应用的缺陷与改进第2张

一般而言，对于单任务，一个模型的性能能达到90%，但如果需要理解一段话或者一段专业评语，则需要三层模型才能形成一定的特征，这时模型性能就会下降为70%左右的水平。因此，在投资等要求严格的场景下，预训练模型很难应用。

为什么会出现这种问题？个人认为，大规模预训练模型的语料库是大型文本，它注重广度和背景，对于深度和细节较少关注。

以国内企业研发的一些预训练模型为例，其早期改进的方式都集中在Mask层面，而Msak机制更倾向于集中学习信息的广度。而当模型应用到法律、医学等领域时，更需要的是“深度”理解。

如何解决？目前有很多思路，例如加入专家知识，知识增强、混合训练等等。目前，中国平安在探索语义空间分解技术和置信度评估方法。

2
语义空间分解技术

平安科技前沿技术部门负责人王磊：大规模预训练模型在垂直领域应用的缺陷与改进第3张

大规模预训练模型涵盖了很多背景信息，那么能否进行再一次的分解，将背景信息和垂直领域的知识体系分离开来？分解不能没有标准和依据，而大规模语言模型实际上是在处理信号，当模型理解信号的时候，虽然信息和语义仍然在，但却在中间发生了各种形式的变换。因此，无论是哪种大模型，其本质都是将信息或语义重新转述为信号。

那么，既然是信号，就能够进行分解。我们已经尝试了多种方式，其中一种做法是：基于国内机构提出的大规模预训练模型，加入高中低滤波器，然后用自适应频谱机制进行处理，可以理解为一个Attention机制，最后进入下游任务训练。

经过实验表明，我们提出的频谱分解网络结构（Filter-Loss和Filter-layer ），结合经典语言模型训练神经网络，在各类型任务中均可显著提升语言模型能力。

平安科技前沿技术部门负责人王磊：大规模预训练模型在垂直领域应用的缺陷与改进第4张