AiCon 全球人工智能与机器学习技术大会

人工智能和机器学习在滴滴多个业务场景的深度应用和实践 张凌宇

2. 6 78 4 8 0 1 52
7. • • • •
8. • •
9. 0 0 0 0 0 0 0 0 0 0 0 0 … 1 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 … 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 … 0 0 0 0 0 0 ,-. = 1 0 1 2 2 + ∀ j, ' ,-. ≤ 1 ()* 3 3
10. != #=
11. !"×$ &'' ⋮ = &'" ⋯ ⋱ ⋯ &'$ ⋮ &$"
12. Interaction Feature abstract Basic feature Data collection GPS
16. 0 0 0 0 0 0 0 0 0 0 0 0 … 1 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0 … 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0 … 0 0 0 0 0 0 '(×* +,, ⋮ = +,( ⋯ +,* ⋱ ⋮ ⋯ +*( $= &=
17. 0 . 1 '() = 1 + , -./01 0.21 0.49
18. 3 1 0 2- 1 1 − 1 − %&& × 1 − %(& + 0 = 0.2651 2 1 − 1 − %&& × 1 − %(& + 0 -= = 0.45 %&& + %(& != . 0.21 2- 2- 1 % + %(( = 0.35 2 && %&& + %(( -= =1 %&& + %(( != 2- 0.49 1 1 − 1 − %(& × 1 − %(( + 0 = 0.34955 2 1 − 1 − %(& × 1 − %(( + 0 -= = 0.388 %(& + %(( != 1 % + %&( = 0.395 2 (& %(& + %&( -= =1 %(& + %&( !=
19. ) ) / &'( &'( .'( 1 1 ! = % !* = %[1 − -(1 − 1*2 )456 ] $ $
20. max $% + '( 0 5 1 % = ,[1 − 3(1 − 789 );<= ] + = -./ 4./ ;<= ∑0-./[1 − ∏5 (1 − 7 ) ] 89 4./ ∑0-./ ∑5 4./ A-4 × 789 1 789 = 1 + C DEFGH 0 K A89 = I 1 K 0 M. O. ∀ j, , A89 ≤ 1 -./ L L
23. • • - -> • or
24. • • • •
25. • • •
26. T1 T0 K …… Tk
27. Agent: State: Action: or Reward: ) Value Function: ( S Environment: maxVπ(s) = Eπ[Rt+1 + γRt+2 + . . . St = s]
28. !" #$ (&$ , () !* !, !- #+ (&+ , () #. (&/ , 0) T3 Vacant V2 3" ← 52 3" + 7(0 + 952 3* − 52 (3" )) Vπ(S0) ← Vπ(S0) + α(0 + γVπ(S1) − Vπ(S0)) Vπ(S1) ← Vπ(S1) + α(R + γ 2Vπ(S2) − Vπ(S1)
29. A max ∑ i Eπ[Gti S = si]
30. value function F action • state • Action state
32. V0 T0 V1 V3 T1 T2 V2 T3 ? T4 !: ℝ % ×' → ℝ % ×)
33. 1 n I n 1 • C D • D • I T U i • 7 • P2 • • U ) 0 1 i • • • 1 • (( T OI • • • 1 N n • ) • G K L (
34. ୚獈ग़ᐿ绚ᳵ‫ى‬羬 ᳪ矒෸ᳵୌ秇 RNN 覍躭ୗ绚ᳵୌ秇
35. 1P 3 3 2 ( 3 3 3 ( 4 I ) 3 2 3 4 3 O
36. 0 M 1 R G % C R C N:
38. 1898C8 I 8D C78C D -A78 C:8 2 8 C78C 8 C : 70 2 A8 AC AC8 D :K -F D : CA C D87 K A 8 A GA F A AC 7 1 78 A K :0 8 HAC 9AC 1 78 9AC D : 8 7
39. LA LA a o1 1Q C S 2 G b 2 n • o • 3 • 3 • R 0 K o s 2 I • • S S 1 I • • D

相关幻灯片