您现在的位置是:首页 > 人工智能人工智能
产业跑进数字世界,要先迈过安全这道坎
cc博主2022-11-11【人工智能】291人已围观
当数字化转型成为时代的浪潮,企业的发展已经无法脱离数字行为、单打独斗。
各类商业场景与链接的裂变与新生,驱动产业协作数字化的不断升级。
与此同时,参与数字活动的安全与风险,也成为企业融入新产业协作模式的阻碍:区别于个人用户单一的账户与交易风险(如反欺诈、反赌博),企业作为一个高度多元复合的抽象体,其风险的描述、量化、处理更复杂。伴随业务边界和规模的不断扩大,风险也变得更分散、隐蔽且多样。
因此,企业对数字安全的要求也更高,技术面临的挑战也更大。
但相比保护个人用户,针对B端企业用户产业协作的安全科技讨论在声量上却要小得多。
一般而言,企业参与数字化产业协作,关心两个本质问题:一是如何通过数字化获客,让自己发展壮大;二是如何保护自己在数字世界的资产及业务安全。
在今年的云栖大会上,蚂蚁集团提出,解决这产业协作风控的上述本质问题,需要基于“可信 AI”与“可信数据流转”打造底层技术基座。
与C端用户风控相比,B端产业协作风控面临了独特的问题。但过去蚂蚁在C类金融、生活服务风控场景中的技术和实践积累,可以迁移至如今更大的产业协作图景上,且有更多新的发现与思考。
1
企业的数字化发展忧虑
疫情以来,数字活动越发成为企业对外拓展业务、建立合作的途径。
不同于个人在数字世界的活动,企业行走网络江湖,有自己的独特焦虑,例如:千里之外未曾谋面的合作伙伴是否会欺骗自己?找好的经销商是否会违约?
进入实际的协作链条中,企业面临的风险往往也是多方位的。
以产业的上下游协作为例。
许多大型企业的产业链上游有供应商、下游有经销商、直客,当中包括了物流运输协作,货物仓储协作、金融、监管等等多个环节。这其中,每个环节都可能成为安全的漏洞。比如,主体的经营情况、 企业主个人风险、货物风险和价格风险贯穿全链路。
同时,涉及企业众多,一个环节的断裂就可能波及全链条,风险辐射范围巨大,防不胜防。《互联网平台涉税刑事风险报告(2022)》就记录了一个案例:
某物流公司被“发现存在发票与货运业务分离,涉嫌无真实运输服务而过账虚开、虚假运单、虚假托运、虚假抵扣、资金回流等违法违规行为”,直接影响了相关下游企业多达2700余家,许多企业收到协查,面临着补税、滞纳金、罚款,甚至是追究刑事责任的风险。
当我们尝试去研判一家即将合作的企业是否可信以及评估授信额度的时候,单看这家企业的自身收入状况是远远不够的,他的上下游业务是否健康、政策风险、周期风险如何,股权风险,乃至舆情风险等因素,都需要风控人员用全局视角来观察和计算。
然而,这些复杂的工作,在很多企业中仍主要以人工为主。其参考的信息和数据往往是碎片化的,需要通过风控人员依靠过往的知识和经验来进行判断、生成报告,再经由层层审批来推进。一家企业的尽调往往需要三天到一周的时间,耗时长,对于大规模的企业来说,长此以往,人力成本非常高。
除了成本,企业风控也面临数据孤岛的问题:风险研判的数据来源涉及多个不同主体,包括工商、支付机构、银行等。为保护数据隐私,机构之间往往数据不互通,风控难度增加。
在这场探索中,AI 与数据成为两个突破口。
2
千行百业各有门道
可信技术如何更懂人?
在产业风控的链条上,藏着三个核心难点亟待解决:庞杂数据的归集聚合、基于多元场景下的AI模型应用、以及全局视角的风险研判。
从这三个问题出发,蚂蚁提出了自己的思考,并基于“可信 AI”与“可信数据流转”的底层技术能力,提供了相应的解决方案。
打破数据孤岛,搭建可信数据流转通道
企业是一个复杂的经营体,一个企业的数据也往往比个人数据复杂得多,既包含工商、司法、舆情等公开数据,也包括税务、发票及报关等其他数据,面对这些维度多且来源分散的数据,梳理起来并不容易。
同时,数据与其他生产要素也存在非常大的区别。数据管控和保护难度大,但在复制和造假上却几乎是零成本,这就导致了数据作为“新石油”在推动产业增长时,企业和用户对个体数据共享和流转安全的担忧。
位于孤岛的数据只是一串串数字,其价值难以被发挥。
不仅如此,今天的数据与十年前的数据也存在极大的价值差距。企业使用近一年内的样本来进行模型测算,与使用五年以前的数据来测试模型,其最终结果往往是时间距离更近的、更符合实际场景的应用。
这就意味着,要实现产业协作数据价值的最大化,就必须在保证安全、可信、合规的情况下共同推动可信数据流转,从而解决产业上下游协作的信任问题,也可以用于各机构和企业间建立合作,共同抵御同一类风险。
以联合反诈为例,此前为打击治理电信网络诈骗,公安、银行、运营商、蚂蚁集团联合各自积累的黑名单数据,运用区块链、隐私计算等技术为C端用户实施主动风控,通过智能弹窗唤醒,延迟到账或资金截留等方式,尽量阻止欺诈交易的发生。
蚂蚁一直致力于用技术,将流转的可信数据同横向、纵向产业协作链条连接起来,打破数据孤岛,采用端云协同的模式,实现更智能、更协同的风控。
在蚂蚁集团数字科技事业群安全科技技术总监章鹏看来,要实现可信数据流转,根本上是解决三个问题:
第一,是数据流通基建的搭建。
蚂蚁安全科技团队基于区块链技术,建立了一个数据资产的可信流转通道,企业包括工商、司法、产业链、发票、税务等多元多模的数据,都可以通过这个管道合法合规地做数据流转应用,保证了数据的安全性、合规性和隐私性。
同时,在这个基建的基础之上,区块链技术对外还能同企业系统进行打通,参与到风险管理、内控、审计、招商等系列的对客产品中。
第二,基于数字协作之上的业务协作。
当我们在特殊场景中,需要协作多方对一个数据进行某种程度的共享,该如何驱动各方对可能涉及自身利益的数据进行披露、并对数据做好安全保护,章鹏表示,“其实就是一个激励机制的设计,这点非常关键。”其关键就在于,让每一方在共享的信息同时能够达到其对应的反馈。
比如区块链技术在反赌反诈场景中的使用,数据在分布式账本上的可追溯性贯穿整个反馈环节,最终可以实现对单个数据量级逐一的评估和分配。
第三,可信数据流转的平台支撑。
章鹏认为,系统化对于可信数据流转的价值体现颇为重要,我们需要一个一体化的智能工作平台,将可信数据的流转、汇总、计算、聚合和 AI 模型的搭建等能力,应用到整个产业协作的准入、授信、拓客、营销、欺诈、监控预警等各个场景中,为产业风控提供强有又力量的平台支撑。
AI 可解释性实现风控量化模型双向“理解”
第二个难题“基于多元场景下的AI 模型应用”,在产业协作中,也即是企业怎么用一个模型对不同的合作对象做决策的问题。
在判断是否跟一家机构或企业合作时,很多企业都会用到评分卡模型,模型会根据基本信用和基础行为来预测是否为目标企业,是否存在主体风险等维度进行打分,其结果可能会出现原本意向企业 A 得分为60分,不被纳入考虑的企业 B 反而得分高达85分等情况,为什么会出现这样的评分差距?判断的标准是什么?AI 都需要进行解释。
简单来说,就是让企业理解 AI 模型是如何得出评分结果的,这里面就需要用到可信 AI 中的可解释性。
在蚂蚁看来,B端不仅要强调算法本身的性能,更要强调算法的可解释性。
风险识别和评估是个颇为“主观”的难题,在产业协作的过程中,防控应该设置在哪些环节?风险提醒是否精准?对不同企业来说都有不一样的答案,风控不仅要做到精准识别,还要解释为什么拦截,这对 AI 模型的可解释性是个非常大的挑战。
可解释性,是指 AI 在基于当前所掌握的数据,给出具有解释性的识别结果或决策;章鹏指出,在产业风控中,可解释性本身不仅要让人理解模型,还需要让模型读懂人。
图注:章鹏在云栖大会谈安全科技
产业风控涉及行业知识很多,以往对从业人员的知识积累和经验沉淀都有较高的要求,“不同的行业有自己比较多的一个经验,有些所谓的经验可能并不是那么绝对,有一定的模糊性,但它又需要被尊重、被理解。”章鹏补充道。
基于这样的考量,蚂蚁在搭建 AI 模型时,都会考虑怎样把已有专家经验的知识、法规法条等融入到模型中。
例如此前蚂蚁在搭建评分卡模型的过程中,就通过对重要领域的经验进行优化,将其和更多的知识规则注入到代价函数,从而获得具有优越的交互性和可理解性的评分卡。其根本目的也在于实现“让模型读懂人”,让企业对上下游数据实现更精准的划分和判断,从一个更全面的视角来选择更优质的合作对象。
在章鹏看来,之所以风控中对可解释性要求非常高,还因为黑盒模型作出的决策可能对企业自身和协作方的利益带来极大的影响,“如果不能理解模型、或是跟预期不一致,客户的验收或接受本身也是一个困难。”
也就是说,AI 不仅要能够精准地判断风险,并且得出的结果也要有理有据、令企业信服。
除了 AI 的可解释性外,在走向能力输出或商业化的过程中,还需要考虑到鲁棒性、公平性、隐私保护等可信 AI 的关键技术,例如对规模大小不一致的企业在数据收集方面的公平性,建模样本差异的区别对待等等。
章鹏告诉 AI 科技评论,不管是做B类风控还是C类风控,本质都是需要可信 AI 及可信数据技术驱动的。
可信 AI 是蚂蚁的天生属性,与蚂蚁创立以来提出的普惠科技的价值观及业务紧密关联。
自2015年以来,在长达7年的探索与实践中,蚂蚁已经逐步梳理并确立了包含“可解释性与因果分析” 、“数据隐私保护”、和“公平性”在内的技术架构体系。在2021年6月,IPR Daily发布的首个“ AI 安全可信技术”领域全球专利报告中,蚂蚁集团的专利申请数和授权数,均位列全球第一。
而聚焦到产业协作上,蚂蚁也从可信 AI入手,从底向上实现数据的可信聚合、有效挖掘。
搭建产业事理图谱
为了解决第三个难题“全局视角的风险研判”,蚂蚁推出了产业风险的事理图谱,通过对海量数据的挖掘和专家刻画,对企业多元多模信息进行了聚合。
章鹏介绍,做产业事理图谱分为两步,第一步、将数据挖掘出来,第二步、在图谱上做数据传导。
举个例子,当某家核心企业想判断下游企业的收入情况是否会对中上游带来影响、影响多少,可以收集下游企业的扩展关系构建一个“上下游闭环挖掘”图谱,用图神经网络搭建一个企业关系度量和企业路径查询的算法进行训练,通过数据来帮助核心企业判断是否合作。
当前,蚂蚁产业事理图谱在企业的股权结构风险、关联风险度量、开放事件传导和风险线索汇集等多个场景中均有应用。
将企业数据在图谱上进行聚合,经由产业事理图谱做推理,可以将原本手工化需要几个小时、甚至几天的流程时长缩短到几分钟,大大提高了企业对风控研判的效率,从而更早、更快发现风险,对风险的挖掘也更深入。
3
基于可信 AI +可信数据技术的安全科技
过去十年里,产业数字化变化持续发生,从第一阶段以机构自身数字化为主,实现 IT 生产效率提升,到第二阶段产生了大量数据后,数据的共享和流通,使更紧密的产业协作成为可能。
蚂蚁集团安全科技也是数字化浪潮中的推动者和参与者,在2017年所研发的面向智能风控的安全科技商业化产品“蚁盾”,正是希望用蚂蚁在风控领域的探索实践成果,去帮助合作伙伴解决数字化发展过程中的营销拓客、平台交易、产业协作等场景下的安全风险问题。
比如在服务某贸易集团的纵向协作风控时,面对该集团5万多家的合作方(上下游、物流和仓储等企业)的尽调工作,蚂蚁安全科技团队与该集团合作构建了一套端到端的风控平台:
在事前准入环节,帮助企业内部和外部搭建起多元融合的数据管道;在事中分类评级授信环节,完成数据规则的搭建,从一个更全面的视角来判断目标合作企业预付和赊销的额度,从而达到资金的效用最大化,并对整个决策流程和场景进行实时监控;在事后排查中,以秒级实现了相关企业重大舆情等事件报告和结果的解析......
可以看到,蚂蚁基于“可信 AI ”和“可信数据流转”的能力,已经实现了对产业协作全链路工作的覆盖,帮助企业在风控效率上大幅提升,在可信环境中完成可信交易。
蚂蚁数字科技产品总监张世晶在分享中透露,基于可信 AI 及可信数据技术,蚂蚁打造的安全科技产品在国内已覆盖金融、出行、租赁、零售电商等10余个行业,服务客户1000余家,在海外已帮助数十家合作伙伴服务客户超1亿。
产业发展是一个持续叠进的过程,随着大数据、云计算、区块链等技术兴起之后,数字化协作升级成为下一阶段的重要命题。在这场漫长的马拉松背后,决定企业能跑多远的一个关键性要素,正是风控。而基于可信 AI 和可信数据流转的安全科技能力,是推动风控升级的核心要素,在推动产业数字化升级、实现数字化进程持续加速的今天意义非凡。
(雷峰网(公众号:雷峰网)雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
Tags:
相关文章
- 生僻字可输入,腾讯联合工信部电子标准院、汉仪字库发起汉字守护计划
- 行业第一!腾讯云区块链解决方案再获IDC权威认可,加速数字政府建设
- 使用Clash增强模式(Enhanced Mode)实现全局代理
- 蚂蚁蒋国飞:产业链协作数字化是工业互联网发展的重要方向
- 扎克伯格承认决策失误致Meta裁员超1.1 万人;李彦宏称AI作画像拍照一样简单;广场舞APP向老年人非法集资8.7亿丨雷峰早报
- 2022世界互联网领先科技成果发布 蚂蚁集团自研分布式数据库OceanBase获奖
- IJCAI 2022 China 在深圳坪山召开,高文、杨强、张正友、周志华等等 AI 大牛出席
- 蚂蚁集团井贤栋乌镇分享:数字科技可为全球合作发展增添新动能
- 世界互联网大会开幕 周鸿祎:360上线SaaS商店为中小微企业降本增效
- 开启中小企业数字化"慧眼"卡奥斯首发工业视网膜平台