阿里巴巴基础运维平台实践

Razor

2017/09/12 发布于 技术 分类

阿里巴巴基础运维平台实践

文字内容
1. 阿里巴巴w础运维平台实践 宋健C宋意D
5. 关O我 •  姓o:宋健C宋意D •  现任:运维M台E技术K家 •  负责:w础运维平台 •  经k: 2008 某企L独立负责服is与网络运维 2010 T无到有建立支U宝监控体系 2012 推动阿里集t监控体系统一 2014 负责运维工c&线IPEt队 2016 负责w础运维平台
6. 阿里运维体系 w础运维平台 StarAgent Ծߝຝ຅! ᔮᕹຝ຅! ೴౴/ᳯ᷌! StarOps Ծߝቘஷ! Ծߝ‫ۑ‬ᚆ!
7. 问题 •  百万级规模服is运维体系如何设计G
8. 对比 ๐‫࢏ۓ‬ᥢཛྷ ᇙᅩ ૡٍ ‫̵܈‬ጯ! ᓌ‫̵ܔ‬ො‫!׎‬ ᚕ๜̵ԯᛔଃ! ‫̵܉‬ӡ! පሲ̵ᑞਧ! ୏რ(puppet/salt/ansible)! ‫܈‬ӡ̵ጯӡ! ਞ‫̵ق‬ᑞਧ̵௔ᚆ! ᛔᎸҁ‫੶ړ‬҂!
9. 阿里运维体系 ॠሞ! ඪ՞ਪ! ោề! ṛ஛! Ⴃਪ! ᴨ᯾ԯ! սᯡ! ……! ଫአ/හഝପ/Ӿᳵկ ᬩᖌ! ਞ‫֛ق‬ᔮ! चᏐᬩᖌଘ‫ݣ‬-StarAgent! ๐‫!࢏ۓ‬ ๐‫!࢏ۓ‬ ๐‫!࢏ۓ‬
10. w础运维平台
11. StarAgent ጯӡᕆ๐‫࢏ۓ‬ᬩᖌ᭗᭲! •  ‫ق‬ᗑࠔӞᓕഴ᭗᭲҅๦ᴴᦡᗝ̵඙֢ਭᦇ̶! •  Ԇ๢ᯈᗝ҅Agent̵ᚕ๜̵ᨴ‫̵ݩ‬ਧ෸ձ‫ۓ‬ᒵ̶! ᨽᑯ๐‫࢏ۓ‬ኞ޸ޮ๗! •  ᩒԾ໐੒! •  OSਞᤰ! •  ଫአ‫!૲ݎ‬ •  ଫአፊഴ! •  ෭ଉᬩᖌ! •  ……!
12. 产r架构 运维系统/运维人p Portal/API/CLI w础功能 插X功能 命W通道 运维市u /EB终端 监控 日志 安全 数据通道 文X通道 定时任i 硬X 调度 … 管控通道 服is Agent! 插X平台 服is Agent! 服is Agent!
13. 系统架构 ! Portal! ! ! ! Config Service! Proxy Cluster! ! IDC 1! Agent! Channel Cluster! ! ! ! ! Agent! ! IDC …! Agent! Agent! Channel Cluster! ! ! ! ! Agent! ! Agent!
14. 功能 API! • Cmd! • Plugin! • File! • Store! • Cron! • Action! Portal! • ᬩᖌ૱࣋! • WEBᕣᒒ! • ෈կ‫!ݎړ‬ • ਧ෸ձ‫!ۓ‬ • Ԇ๢ᨴ‫!ݩ‬ • APIᨴ‫!ݩ‬ Agent! • Hostinfo! • හഝ᭗᭲! • ीᰁ෭ப[ൊ կ]! • P2P෈կ[ൊ կ]!
15. 数据 •  API调用量:1亿+/x •  系统能力:50万台/e •  管理服is能力:百万级 •  插X数量:150+ •  Agent性能:mem<20m cpu<2% •  支持linux/windowsN流l行版
16. 挑战 ᑞਧ! ਞ‫!ق‬ ሾह! ‫ݶ‬उ‫݌‬๢಄! ṛ‫޸ܧ‬եᴥෙ! ፊഴහഝ಑᭗! ୑ࣈग़Ӿஞ! ‫ق‬᱾᪠‫ੂے‬ᓋ‫!ݷ‬ चᏐ‫௳מ‬᯻ᵞᑕଧ! ݄ਂ‫ؙ‬୩ׁᩢ! ޸եฉ੘!
17. 问题
18. 解d ᔮᕹᳯ᷌! •  ‫૲ړ‬ୗၾ௳ຝ຅! •  ᛔۖಘᖽ਻̵ᛔۖᨮ᫹࣐ᤍ! ሾहᳯ᷌! •  ಑᭗ፊഴහഝ҅ᛔۖᬬࢧ๢࢏ᇫா̶! •  ᰓᰓ๢࢏Ոᛔۗ᦬ෙ̶! ᥢ᝜ᳯ᷌! •  വۖ‫ګ‬ਧᕹӞᥢ‫!ڞ‬ •  ᰒ੒ᥢ‫ڞ‬൉‫׀‬ੜૡٍ!
19. StarOps Ӟᒊୗᬩᖌଘ‫!ݣ‬
20. 产r理念 ຽ‫ٵ‬۸! 传统运维 (ODe离 ᛔۖ۸! ฬᚆ۸! 新v运维 (DevOps
21. 产r边界 运维线 运行 监控 研l线 项目 V码 测试 构建 l布 配置 资源
22. 产r功能 Portal/API/CLI 资源 管理 配置 管理 l布 服i 监控 服i 运行 管理 AGE)T a有P 私有P LinuA/UniA//indows XE)/KV(/DockerB LinuA/UniA//indows XE)/KV(/DockerB 安全 管理
24. 联系我 •  钉钉n:songjian •  微信n:ipython