知识图谱在金融场景中的应用探究

wwwwwk

2019/08/01 发布于 金融 分类

文字内容
1. 汇报人:KG101 汇报日期:2019-7-24
2. 目录 01 02 03 知识图谱简介 金融应用场景 应用案例 04 反思与总结
3. 01.知识图谱简介 • What? • Why? • How?
4. What:什么是知识图谱 其本质上是语义网络,基于图的数据结构, 由节点 (Point) 和边 (Edge) 组成 节点:现实世界中存在的“实体” 边:实体与实体之间的“关系” 知识图谱是关系网络最有效的表现方式
5. Why:为什么要构建知识图谱 DB->BD 数据性质 • 数据规模较小 • 类型单一,结构化数据 大数据 时代 数据模式 • 可预先确定 • 现有数据模式后产生数据 • 数据模式相对固定 数据库 时代 • 数据量较大 • 类型较杂,含结构化、半结构化、 非结构化数据 • 无法预先确定 • 模式在数据产生之后才能确定 • 数据模式随数据增长不断演变 处理方法 One Size Fits All. No Size Fits All.
6. Why:为什么要构建知识图谱 多源异构数 据难以融合 大数据时代, 企业使用全量 数据遇到众多 挑战 数据模式动 态变迁困难 分散的数据难以 统一消费利用 使用知识图谱进行抽象建模,基于可动 态变化的“概念—实体—属性—关系” 数据模型,实现各类数据的统一建模 使用可支持数据模式动态变化的知识图 谱的数据存储(事理图谱) 在知识融合的基础上,基于语义检索、智 能问答、图计算、推理、可视化等技术, 提供统一的数据检索、分析和利用平台
7. How:怎样构建知识图谱
8. 02.知识图谱的金融应用场景 • 风控 • 营销 • 预测
9. 如何落地金融行业知识图谱 04.知识应用 风控、营销、预测等业务场景 03.知识存储 02.知识计算 分布式混合存储技术架构 对隐性关系、扩展属性、标签及子图进 行大规模计算。得出企业客户之间关系 01.知识构建 设计金融机构知识图谱数据模型
10. 知识图谱的金融应用场景 应用 场景 智能 投研 核心 能力 智能问 答系统 基础 技术 智能 投顾 咨询舆 情分析 知识图谱 智能 风控 金融预 测分析 智能 监管 智能 客服 文档信 息抽取 自动文 档生成 NLP 智能 运营 风险评估 与反欺诈 客户 洞察
11. 2.1 知识图谱的营销应用 • 挖掘潜在用户 • 用户画像分析
12. 金融营销类应用 1.挖掘潜在客户 1.建立社交网络知识图谱 2. 定义个性化的图谱关系模型 * 亲朋好友的推荐? 3.社交挖掘,对特定人群制定营销策略 ->受众太少,全靠人缘 * 漫无目的的电话营销? ->成功率低 * 大肆的广告宣传? ->成本高,没有针对性 OLD NOW 客户挖掘
13. 金融营销类应用 1.挖掘潜在客户 基于现有VIP客户,挖掘相关联系人,有针 小王 A理财产 品客户 对性地对某类人群制定个性化营销策略。 e.g. 我行客户小王购买了某理财产品A,通过知识 图谱,了解到小王参加了某高尔夫俱乐部并在其内 消费产 品 高尔 夫俱 乐部 这些人员进行风险评估后,向其推荐与A类理财产 品类似的相关产品。 一类 消费产 品 消费产 品 小段 二类 三类 有大量一类消费行为。 可分析俱乐部内与小王相似消费行为的人员,在对 小马 小顾 小阳 银行
14. 金融营销类应用 2.用户画像分析 Goals: *提升营销效果 *改善用户体验 *降低成本 *实现用户针对性管理 当前画像的主要问题 基于知识图谱的用户画像 标签不全,数据稀疏 基于社交图谱的标签拓展 隐私保护,不准 基于知识图谱的标签拓展 噪音标签,粒度太细 标签泛化,精准营销
15. 金融营销类应用 基于知识图谱的跨平台推荐 普通理 财 给微信商户推荐银行理财产品 产品 资金往来 高端理 财 银行 产品 微信 平台信誉 信誉度 思路: 平台客户 平台客户 1. 利用知识图谱嫁接不同的平台 2. 根据微信商家的经营范围和交易流水, 勾勒出其资产范围 微信商户A 消费 微信商户B 消费 经营 经营 3. 千人千面,推荐不同级别的理财产品和 方案 珠宝 食品
16. 2.2 知识图谱的风控应用 • 反欺诈 • 失联客户管理 • 反洗钱
17. 金融风控类应用—反欺诈 传统反欺诈 1 知识图谱反欺诈 2 真实、繁琐 依赖人工审核信息真实性 真实、实时、关联、风险可视化 * 整合多源异构数据 *“点”资料核查 ->从“面”的 欺诈风险检测
18. 金融风控类应用—反欺诈 借款人基本信息 不一致检验 资产情况 信用消费 异常点检测 异常关联数据 识别 借贷人知识图谱 消费记录 关联分析 行为记录 图挖掘 浏览记录 知识推理 借贷资格审核 实时监控
19. 金融风控类应用—反欺诈 案例1-信贷资格审核 866万
20. 金融风控类应用—反组团欺诈 24 中国地 质大学 硕士 25 年龄 年龄 毕业于 学位 毕业于 邓铮 借款 2017年3月13日 王涵 居住于 居住于 学位 借款 2017年3月13日 地址 银行 居住于 借款 2017年3月13日 段永胜 结合图谱挖掘,迅速发现欺诈 团体。 硕士 三个借款人同一天向银行发起 借款,他们是互不相关的人, 但是他们留了相同的地址,这 银行 借款 2017年3月13日 武汉理 工大学 时有可能是组团的欺诈。
21. 金融风控类应用—失联客户管理 虚线表示历史关系,当前该关系已经结束 实线表示当前存在的关系 某公司A 法人 电话A 某人A 某公司B 法人 法人 某人B 夫妻 法人 地址A 某公司C 在贷后失联客户管理的问 题上,知识图谱可挖掘出 更多潜在的新联系人,提 高催收成功率 电话B
22. 金融风控类应用—反洗钱 不一致检验 公司银行 子账户信息 异常点检测 反洗钱知识图谱 关联分析 图挖掘 知识推理 追踪异常交易 途径 识别可疑账户
23. 金融风控类应用—反洗钱 $ 子账户 银行想了解XX公司 是否有洗钱行为 银行 子账户 子账户 子账户 子账户 子账户 公司A 嫌疑人 公司B 嫌疑人 子账户 子账户 子账户 子账户 子账户 子账户 子账户 子账户 XX城市 子账户 子账户 XX公司 找到该公司所有 银行的子账户 找到跟所有子账 发现可疑的账户存在地理 扩展交易账号,通过得到高频 户交易的可疑账 位置巧合,继续追踪,得 的可疑账号,发现可疑的公司 户,红色表示 到黄色账户 A和公司B,找到洗钱的嫌疑人
24. 2.3 知识图谱的预测应用 • 风险行业预测 • 风险企业预测
25. 金融预测类应用 潜在风险行业与企业预测 Step 1 • 获取数据源 Step 2 • 构建行业知识图谱 • 关联分析,图计算 • 最短路径查询,知识推理 Step 3 • 关联企业/行业识别 • 获取影响力/感应力系数
26. 金融预测类应用 行业划分 企业客户数据源
27. 行业风险预测 所属行业 企业资讯 社会舆情 监测到 行业热点 企业A发生 事件 影响 上下游产业链 关联子母公司 其他行业 风险预警 合作公司 对手公司 观点挖掘 情感分析 传播分析 企业关联分析 行业关联分析
28. 企业客户风险预测 基本信息 社交知识图谱 企业知识图谱 投资时间序列 银行流水时序 纳税时间序列 不一致性验证 异常分析 关联企业出现事故 行业关联度 投资金额异常 被投企业风险 流水出现异常 反洗钱 纳税金额异常 时间序列分析 检测企业数据异常 企业交互风险预测 企业投资风险预测 企业欺诈风险预测 企业纳税风险预测
29. 03.基于企业知识图谱的风险控制 --以湖北广电为例
30. 湖北广电贷款风险控制 生成知识图谱,进行关联挖掘 本体构建 实体对齐 数据整合及知识表示 • 通过构建企业知识图谱,挖掘出湖北广电及 其上下游企业 • 在对湖北广电进行贷款审核时,发现其下游 企业同洲电子存在供货不足问题 知识抽取 获取数据源 • 根据风险关联为银行贷款审核提供辅助决策
31. 湖北广电贷款风险控制 进行关联挖掘 生成知识图谱 实体对齐 数据整合及知识表示 知识抽取 获取数据源 e.g. 湖北广电<->湖北省广播电视信息网络股份有限公司 湖北广电--主营业务--数字电视投资 抽取企业、董事长、供应商、供应占比等实体和关系 结构化数据:公司内部客户信息数据库、第三方数据库 半结构化数据:企业年度报告、季度报告等 非结构化数据: 金融类新闻、企业公告等
32. 知识图谱构建与应用 2017年8月19日,上市公司同洲 电子原实控人、原董事长、资本 高手袁明在机场被债权人围堵, 从登机口活生生被拉了出来。有 网友爆料,其曾套现24亿跑路 同洲电子公司存在风险 同洲电子是湖北广电的下游公司 对湖北广电进行贷 款审核时应谨慎
33. 04.反思与总结
34. 落地金融行业知识图谱所面临的挑战 策略的生成 仅能辅助决策 领域知识的集成 领域知识复杂 数据的可发现性 数据噪声大 数据的深层关系 关系难抽取 数据的可访问性 数据孤岛
35. 总结 • • • • 数据整合 知识图谱 数据关联展示/交互 统计分析展示/交互 地理/时间信息展示/交互 数据细节展示/交互 所见即所得 图数据库 • • • • • 关联挖掘/推演 全文智能检索 数据导入和语义分析 时空数据统计 结合行业和业务应用 的规则进行算法跑批 关联分析数据挖掘 • 辅助决策 • 高度定制化与自 定义开发和展现 与人类智慧结合
36. 汇报人:KG101 汇报日期:2019-7-24