议题十一 华为GPU Turbo背后的研发能力 华为方卫庆

Razor

2018/11/20 发布于 技术 分类

文字内容
1. 大会视频回放链接:http://www.itdks.com/eventlist/detail/2823
2. GPU TURBO背后的研发能⼒力力
 EMUI ⽤用户体验优化的极致追求
3. EMUI⼀一路路⾛走来 不不断提升⽤用户体验 1.0 2.0 3.0 合⼀一桌⾯面 ⼿手机管家 全新UI设计 2012/07 2013/11 2014/09 3.1 情景智能 指关节截屏 2015/04 4.0 防伪基站 专业相机 2015/09 4.1 徕卡双镜头 学⽣生模式 2016/02 5.1 简约精致 超强通信 2017/02 8.0 ⼈人⼯工智能芯⽚片 智慧体验 2017/10 5.0 天⽣生快⼀一⽣生快 18个⽉月不不卡顿 2016/11 Mate9 8.1 AI摄影⼤大师 徕卡三镜头 2018/03 8.2 GPU Turbo 全新游戏体验 2018/06 P20 荣耀Play
4. 每⼀一次体验提升都是复杂系统⼯工程 Android 原⽣生应⽤用 EMUI 原⽣生应⽤用 第三⽅方Apps Android Framework EMUI Framework 框架层 通信 智能 资源 功耗 性能 安全 连接 媒体 基础核⼼心库 Graphic 数据库 虚拟机 硬件 抽象 驱动 中间件 系统运⾏行行 环境 进程 管理理 内存 管理理 通⽤用外设驱动 内核 ⽂文件 系统 ⽹网络 管理理 安全 管理理 芯⽚片驱动 芯⽚片 CPU GPU DSP NPU
5. EMUI 的每次突破 源⾃自于⻓长期的技术积累 EMUI 4.X EMUI 5.X EMUI 8.X 天⽣生快 ⼀一⽣生快 GPU Turbo TEE OS 指纹 SensorHub LiteOS 精简UI 虚拟机优化 数据库优化 (GC/AOT) (IO并⾏行行) 新⽂文件系统 F2FS UltraMemory iAware ⼈人⼯工智能 机器器学习 资源分组调度 图形引擎 直达服务 AI引擎 数据库 ⽂文件系统 F2FS 类似于iAware的 后台应⽤用管理理 Vulkan图形引擎
6. Chapter One 天⽣生快 · ⼀一⽣生快
7. 对卡顿背后的深究,打造出天⽣生快、⼀一⽣生快 安卓系统的松散管理理 应⽤用缺少约束,使得应⽤用质量量 参差不不⻬齐 系统资源不不⾜足 应⽤用没有优先级 应⽤用链加剧资源消耗 存储空间碎⽚片化 经常保存、删除⽂文件,导致 存储空间碎⽚片化,存取⽂文件 速度下降 数据⽇日益庞⼤大 图⽚片、联系⼈人等数据量量越来越 ⼤大,数据库查询、搜索速度缓 慢
8. 天⽣生快、⼀一⽣生快是⼀一系列列技术的组合 ⼈人⼯工智能学习系统 预测使⽤用⾏行行为 预先调配资源 安卓组件优化 智能内存调度 AI 智能存储调度 F2FS新型⽂文件系统 智能CPU调度
9. F2FS 新型⽂文件系统 ● Flash-Friendly File system 专为NAND⽽而⽣生 ● F2FS 解决EXT4⽂文件系统的⼀一系列列问题 随机写优化60% 碎⽚片化的性能优于EXT4 ● F2FS的关键技术 数据分配管理理算法 NAT技术 垃圾回收算法 数据异常掉电保护
10. F2FS-专⻔门为NAND设计的新型⽂文件系统 ● Ext4最初并没有针对闪存作太多的优化 ● F2FS针对闪存的优化,基于闪存的块进⾏行行读写,⼩小⽂文件的随机读写性能⼤大⼤大提⾼高 Logical Address File System FTL ROM SRAM Controller Mapping Table Physical Address Flash Memory
11. F2FS 新型⽂文件系统关键技术- 数据分配管理理算法 元数据区域:就地写⼊入 数据区域:SSR写⼊入和LFS写⼊入;多点写⼊入技术 元数据区域 Random Writes 数据区域 Zone: data block group Section: FTL GC unit Sequential Writes Zone Section Section Segment Number 1 segment=2MB 0 1 2… Zone Section Section Zone Section Section Zone Section Section Super block 0 SB Main Area Super block 1 SB Check point Area Segment Info. Table (SIT) Node Address Table (NAT) Segment … Summary Area (SSA) … Hot/Warm/Cold node Segments Hot/Warm/Cold data Segments
12. F2FS 新型⽂文件系统关键技术- 数据分配管理理算法 SSR和LFS协同配合技术 •传统的LFS 写⼊入 有效 ⽆无效 有效 有效 空闲 空闲 •SSR ( Slack Space Recycling ) 写⼊入 有效 ⽆无效 有效 有效 空闲 空闲
13. F2FS 新型⽂文件系统关键技术- 数据分配管理理算法 多点写⼊入技术 • 将不不同类型,不不同热度数据写⼊入不不同的段 • 提⾼高垃圾回收效率 Type Node Data Temp. Hot Warm Cold Hot Warm Cold Object Direct node blocks for directories Direct node blocks for regular files Indirect node blocks Directory entry blocks Data blocks made by users Data blocks moved by cleaning; 
 Cold data blocks specified by users;
 Multimedia file data
14. F2FS 新型⽂文件系统关键技术-引⼊入NAT 解决Wandering Tree 问题:引⼊入NAT(Node Address Table) ●传统的LFS⽂文件系统容易易引起滚雪球效应 ●引⼊入NAT解决,解决GC的负担 SB CP Inode Map Inode Inode Directory data File data … File data Indirect Pointer block Direct Pointer block SB CP NAT Segment Info. Table(SIT) Segment Summary (SSA) Dir Inode File Inode Indirect Node Directory data … File data File data Direct Node S B S CP SIT B SSA NAT Direct node blocks for directories Direct node Indirect node Directory data File data blocks for blocks regular files Cleaning data
15. F2FS 新型⽂文件系统其他关键技术 F2FS垃圾回收算法 • 对于F-GC,直接使⽤用Greedy回收策略略,选出需要回收的段 • 对于B-GC,如果空闲空间少,也会直接使⽤用Greedy回收策略略,⽽而如果空闲空间多,则会使⽤用CB策略略 F2FS 异常掉电保护 • 使⽤用Checkpoint机制来保证⽂文件系统的⼀一致性 • F2FS维护了了两份检查点:⼀一个是稳定的,⼀一个是正在使⽤用。在恢复过程中,使⽤用的是稳定版本
16. FSTRIM 上的优化解决原有设计的不不⾜足 优化FSTRIM的触发策略略上⼈人性化设计 Original Trigger •After 3AM •Charging •Device Idle ⽩白天习惯充电的⽤用户 CHARGING 3AM 夜晚关机充电⽤用户 TIME LINE
17. FSTRIM 上的优化解决原有设计的不不⾜足 实时可打断机制的实现 Framework Native Kernel Mount Service Socket Command: stoptrim Vold Send Signal SIGINT ioctl fstrim 监控⽤用户点亮屏幕和结束屏保事件, 发送stoptrim命令到Vold Vold中添加命令 stoptrim,发送 SIGINT信号运⾏行行状态的TrimTask, 结束执⾏行行 在内核层fstrim ioctl实现中检查是 否有SIGINT信号pending,如果有 则中断执⾏行行
18. 更更精细的TRIM优化 ●Discard异步化 ●Discard实时化 – Small Discard ●Discard智能化 IO感知 器器件空间感知 ●Discard智能化策略略 依据不不同的状态智能调度不不同模式-寿命模式、均衡模式、性能模式
19. Chapter Two GPU TURBO
20. 厚积薄发体验不不断突破,软硬协同的图形加速技术 ⾼高性能 图形处理理效率提升 60% 更更省电 平均SoC能耗降低 30%
21. 提升基础体验,打破⼿手机游戏图形渲染的”跷跷板” 全⾯面收集和调研游戏槽点 根因分析和归类 性能 功耗 发热 分解⽅方案,制定⽬目标 增强图形处理理效率 增强资源调度&温控 触控 降低触控时延 ⽹网络时延 降低⽹网络时延 依托华为的技术积累和综合研发能⼒力力,打造软硬协同的图形加速技术
22. 深⼊入理理解游戏及引擎,软硬协同提升游戏体验 Game APP Game Engine Unity Unreal Engine … 结合游戏场景、游戏引擎特点细化优化⽅方向 SurfaceFlinger HWC OpenGL ES/Vulkan GPU DDK Gralloc CPU DDR GPU 围绕游戏图形图像渲染、显示的处理理优化, 结合GPU能⼒力力,⼤大幅提升图形图像处理理效率
23. Stay Tuned 提升⽤用户体验的新挑战
24. ⾯面向开放的⽤用户体验提升的新篇章 丰富App场景的多样化,让应⽤用更更智能-HiAi Engine 提升⽤用户App体验的丰富性-多媒体能⼒力力开放 其他更更多
25. HUAWEI HiAI Engine HUAWEI HiAI Engine为应⽤用能⼒力力开放,轻松将多种AI能⼒力力与App集成,让App更更加智慧强⼤大 • CV Engine • ASR Engine • NLU Engine
26. 多媒体能⼒力力开放全景图 玩 1 录播最清晰 ⾼高帧录制 法 美肤 暗光 防抖 开 短视频 放 能 ⾼高帧录制 AI摄影 ⼒力力 笑脸抓拍 Auto Zoom 硬 件 2 精准表情 ⼈人脸变装 百变表情 ⼈人脸特效 直播类 3 乐趣⼈人机互动 ⼈人像分割,百变背景 跳舞机 ⼿手势尬舞 4 拾拾 ⾳音 更更 美 · 聆 听 清 晰 ⾳音频去⻛风燥,杂⾳音 K歌特效 7.1声道 ⻓长视频 K歌类 拍照类 媒体开放SDK 图形和图像系统 超级夜景 视频HDR ⼿手势拍照 美颜美肤 ⼤大光圈 ⿊黑⽩白相机 全景拍照 防抖 ⾳音频系统 低延时⽿耳返 多MIC降噪 Histen⾳音效 K歌特效 华为在业界领先的硬件能⼒力力
27. public void onloadMore() { loadMore(); }
28. 做最好平台 以最开放的⽣生态拥抱开发者 ⼀一起为⽤用户带来最佳⾰革新体验