tutorabc 张明 - tutorabc微服务平台架构实践_部分2

庞晴波

2017/12/18 发布于 技术 分类

ArchSummit全球架构师峰会是InfoQ中国团队推出的面向高端技术管理者、架构师的技术大会,参会者中超过50%拥有8年以上的工作经验。 ArchSummit秉承“实践第一、案例为主”的原则,展示新技术在行业应用中的最新实践,技术在企业转型中的加速作用,帮助企业技术管理者、CTO、架构师做好技术选型、技术团队组建与管理,并确立技术对于产品和业务的关键作用。

文字内容
1. ෭ப! ES Kafka Logstash Kibana Flume ፊഴ! Kafka Grafana Telegraf InfluxDB Chronograf Kapactior SDN 平台入口 蓝鲸网关 ᭄᪵! ES Kafka Zipkin 业务应用 Couchbase (Memcache) ᖨਂ! HAProxy KeepAlived Sentinel Redis ᴚ‫!ڜ‬ RabbitMQ Kafka ෈կ! Varnish Nginx FastDFS Disconf ᯈᗝ!
2. 蓝鲸网关 1. Redirect S 2. Query D K 线上应用 3. Proxy Nginx集群 OpenResty Lua 资源数据 租户权限 SDN路由 日志包-A0级 资源包 资源 资源 资源 Kibana ES CMDB 内网 外网 Docker Registry (私有) Pull Image SaltStack SLS DevOps 控制器 Docker Registry (公有) 线下开发 申请票据 AppKey 申请容量 公有资源 配置 公有资源 配置 私有资源 构建/配置 资源实例
3. TGOP云治理中心
4. •  微服务平台治理之道 •  基础设施平台私有云化 •  APM在微服务平台上的实践
5. APM的三大维度(Gartner 2016)
6. APM与微服务 微服务网 日志 微服务E 微服务C 微服务D 微服务A 微服务B 服务器日志 框架日志 业务日志 A P 追踪 M C A E 事 B D 件 引 监控 擎 硬件 服务框 业务埋 架 点 深度排错 单服务全方位监控、告警 系统全景 微服务网节点状态、依赖关系 数据整合 基于时间轴的基础数据报告 动态采样 全链路下的APM采样率调整
7. APM Stack 推 拉 业务应用 采集通道 业务逻辑埋点 应用设施指标 硬件、OS指标 策略、采样率配置 数据源处理 日志 Elastic 追踪 Search 监控 InfluxDB 事件 引擎 规则 引擎 可视化、报表、配置 DEM AA 监控墙 移动监控 事件时间轴 Grafana Kibana Zipkin UI ADTD 配置 云治理中心 运维 开发 基础设施私有云 虚拟化/容器
8. 采集通道 Log4j Slf4j 日志 LogBack 进程内模型 Log4Net TCP Brave 追踪 Zipkin4Net 监控 InfluxData Measurement Memory Work Queue Confluent Kafka SDK TCP TCP Kafka Stream 微服务框架 - 业务切面埋点 应用日志 - 应用指标 TCP LogStash ZipKin HTTP 业务数据清洗引擎 ES.NET NEST HTTP InfluxData.NET Elastic Search HTTP InfluxDB 操作系统 - 硬件指标 安装、配置 UDP Salt Minion Telegraf
9. 注意事项-日志 •  业务日志与框架日志分离 •  索引与日志级别关联,提高命中率 •  预定义容量保护/清理策略 •  预定义全球化复制/分片/分区策略
10. 注意事项-监控 •  SDK保障InfluxDB中不可存取字符串类型 •  容器运行需考虑硬件IOPS,硬盘使用SSD •  基础监控使用统一DB,业务DB设点上线 •  备份与清理MySQL中的Grafana报警条目
11. 注意事项-追踪 •  实现SDK需了解CS、SR、SS、CR原理 •  跨线程/线程池上下文通过语言特性传递 •  采样率根据团队业务特性进行动态调整 •  公开HTTP头必要信息,推跨系统全链路追踪
12. 注意事项-事件引擎 •  APM所有落地数据需有AppKey特征码 •  部分数据预聚合,控制分析中时间跨度 •  审核控制AppKey自定义的规则数量 •  事件查询页面异步化,降低引擎分析压力
13. 事件时间轴 查看详情 事件类型 发生时间 关联事件列表
14. 监控墙
15. 预警系统