清华大学 张宇韬 - 大规模异构网络数据融合

牵家骏

2017/12/18 发布于 技术 分类

AMiner是全球领先的学术网络分析挖掘系统,基于来自异构数据源的上亿学者、机构、技术概念、科技文献、专利等信息构建了科技领域知识图谱,为用户提供包括专家发现、合作推荐、技术热点趋势分析等功能。为BATH等顶级科技企业及国内外科研机构提供知识智能服务。 异构数据融合是AMiner底层知识图谱构建的核心问题。这次演讲将分享我们在多源异构数据融合、实体排岐等问题上采用的机器学习模型、技术方案及实践心得。

文字内容
3. ^ c cw ^ 0( k a 1 13 ( ve f ^ v k (3IMEP^ ^
4. Z Z Z Z Z Z Zr o o oe e o
5. (3IMEP t
6. Z d
7. Z d
8. Zd Z Z Z Z pr c & f o d s
9. Zd Z Z Z nr l l HWONMWL l WMNMWL
10. Z t x" #$ ⋮ G1 x& x" #$ ⋮ x& x" #$ ⋮ x& x" #$ ⋮ x& x" #$ ⋮ x& x" #$ G ⋮ x& 2 x" x" #$ #$ ⋮ ⋮ x& x&
11. b 3ARCHIMG KS REPIMG G1 G2 G1 G0 G4 G3 G2 ( IGMLEMR G1 G3 G2 …
12. Z l Z ,SCKIDEAM I RAMCE 0ACCAPD ILIKAPIRW ,DIR I RAMCE Z o Z o 3ERPIC 2EAPMIMG Z o 7EOPE EMRARINM 2EAPMIMG
13. o 3ERPIC 2EAPMIMG Z (#(", #($) y( ∈ - y( ∈ {0,1} Z o i 2(3,3) 2(#(", #($)~5( Z 3AHAKAMNBI I RAMCE 67 #", #$ = #" − #$ ;<(#" − #$)
14. o 7EOPE EMRARINM 2EAPMIMG Z ,LBEDDIMG f: ? → A i ^ x ? A • fk ^ x∈? y ∈ Aem Z RPSCRSPE OPE EPTIMG ^ 6(#", #$) < 6(#", #D) → 6(5", 5$) < 6(5", 5D)
15. o Z o Z h Z o Z Z ,LBEDDIMG k Z ,LBEDDIMG k ^ ry
16. o ERUNPJ ,LBEDDIMG [Grover & Leskovec KDD’16]
17. Z UNPD TEC 7 Z Z Z Z
18. Z UNPD TEC 7 Z Z Z Z
19. Z UNPD TEC 7 Z Z Z Z
20. Z UNPD TEC 7 Z Z Z Z
21. ( [Thomas Kipf]
22. Z k b ( [Thomas Kipf]
23. Z • • k b ( [Thomas Kipf]
24. Z :M SOEPTI ED PAM DSCRITE SPE RPSCRSPE Z Z X Y :M SOEPTI ED PAM DSCRITE SPE RPSCRSPE Z 7AMDNL AKJ k Z EEO AKJ MNDE TEC 2 , Z ELI SOEPTI ED MDSCRITE RPSCRSPE (RRPIBSRE
26. X Y Z O [Shin et al. SIGMOD’15]
27. PAM DSCRITE MDSCRITE Z PAM DSCRITE 2EAPMIMG Z MDSCRITE 2EAPMIMG ELBEDDIMG [Jure Leskovec]
28. c ZV 7ECEORITE IEKD [Thomas Kipf]
29. c ZV c
30. Z l c^ l c
32. e Z EI EIKEP 2EHLAM [Thomas Kipf]
33. Z Z IALE E ELBEDDIMG ,LBEDDIMG u ,LBEDDIMG -
34.  0IMG HAMG   HAMGHAI 0IAN NMG :MIT SMMAM :MIT IMGHSA :MIT (KABALA :MIT :MIT N AKI NPMIA ATI APMEGIE 3EKKNM :MITEP IRW .EMAM M RIRSRE N ,DSCARINM
35. Z i Z Z g Z r Original heterogeneous graph Institute 1 I1 Institute 2 I2 Author 1 A1 Author 2 A2 Venue V Publication P K2 Keyword 2 K1 Keyword 1 Context schema of each data type V
36. hi Z Z ,LBEDDIMG Z ,LBEDDIMG Z KS REPIMG MDSCRITE 2EAPMIMG ( IGMLEMR
37. Z Z Zr Z Z nv o gd k iv
38. Z i Z ) i
39. e Z ELBEDDIMG Z e Z Z Z ELBEDDIMG^ Z k ELBEDDIMG
40. e Z )KNCJIMG Z r ^ Z i^
41. Z e Z o Z o Z o Z oe Z Zr
43. r f
44. t