Pivotal Greenplum中国研发总经理姚延栋 - 开源 MPP数据库的不二之选 Greenplum 5.0

贡惜萍

2017/11/14 发布于 技术 分类

本报告主要介绍Greenplum 数据库开源后第一个稳定版本5.0的主要特性, 包括PostgreSQL 新版本合并,异步调度器,优化器增强,基于云的外部表支持,Extension 支持,JSON, 全文检索等. 还会介绍Greenplum 生态系统中相关产品,包括空间地理数据库组件PostGIS,统计分析和数据挖掘算法库Madlib,Greenplum和Gemfire 连接器G2C,基于规则的资源监控和管理器WLM 等的最新进展。报告也会介绍5.0后的一些主要计划, 包括持续PostgreSQL 合并,更稳定灵活的资源管理器,重新设计的备份恢复,本地(in-place)升级,新的数据同步机制,增量备份等。此外还会介绍Greenplum开源社区的发展状况, 特别是中国社区的发展。报告面向人群为对MPP数据库特别是Greenplum数据库感兴趣的管理员、开发人员、数据分析师、数据科学家、数据仓库设计人员和数据库研究人员等。

文字内容
1. 开源 MPP 数据库的不二之选: Pivotal Greenplum 5.0 姚延栋 yyao@pivotal.io
2. 开放源代码
3. SQL
4. 企业级数据库
5. 生态系统
6. MPP
7. 高速数据加载
8. 多态存储 表‘SALES’ 5月 4月 3月 2月 1月 12月 11月 一年前 二年前 行存储 列存储 外部表
9. 并行执行
10. 企业级特性 Chorus Gemfire
11. 使用场景 STRUCTURED QUERY LANGUAGE Text GEOSPATIAL REGRESSION CLASSIFICATION GRAPH CLUSTERING
12. Greenplum 5.0 •  Open Source Based Database •  PG 8.2 à PG 8.3 •  Analyze Speed Enhancement •  Asynchronous Dispatcher •  GPORCA is Default Optimizer •  JSON Type & Functions •  Improved XML Type/Functions •  UUID Type •  Anonymous Code Blocks (Do statement) •  UDF default and Variadic parameters •  DBLink •  Raster PostGIS •  Python 2.7.12 •  Lazy XID (less frequent xid wrap around) •  GP HashAgg Operator •  SubSelect Performance Improvement •  Resource Groups (CPU Targets) (post GA) •  Recursive CTEs (post GA) •  gpload multi-byte delimiters (post GA) •  PXF For Hadoop (post GA)
13. 敏捷开发方法学
14. 社区
15. 社区
16. 加入 Pivotal pivotalrnd_china_jobs@pivotal.io
18. 未来计划 -  PostgreSQL 9.x Merge -  WAL Replication -  Performance enhancement -  Scalability enhancement -  Resource Ma nagement -  Tools new design -  Backup/restore new design -  PGAdmin 4