PolarDB-for-PostgreSQL
Описание
распределённой СУБД PolarDB, основанной на PostgreSQL
Языки
C
- Yacc
- PLpgSQL
- Shell
- Python
- sed
- DTrace
- Makefile
- Perl
- Lex
- C++
- Assembly
- M4
- Roff
- XS
- Ruby
- CMake
- Batchfile
распределённой СУБД PolarDB, основанной на PostgreSQL
https://docs.google.com/document/d/1r5aeChhMX0HBkloJV2PVu5ymXEsdkD5c6oU2dMYtJ7I/edit.
Alibaba, одна из крупнейших китайских IT-компаний, открыла исходные тексты распределённой СУБД PolarDB, основанной на PostgreSQL. PolarDB расширяет возможности PostgreSQL средствами для распределённого хранения данных с обеспечением целостности и поддержкой ACID-транзакций в контексте всей глобальной базы данных, разнесённой по разным узлам кластера.
PolarDB также поддерживает распределённую обработку SQL-запросов, обеспечение отказоустойчивости и избыточное хранение данных для восполнения информации после выхода из строя одного или нескольких узлов. П
ри необходимости расширения хранилища достаточно просто добавить в кластер новые узлы.
Код открыт под лицензией Apache 2.0.
PolarDB состоит из двух составных частей - расширений и набора патчей к PostgreSQL.
Патчи расширяют возможности ядра PostgreSQL, а расширения включают компоненты, реализованные отдельно от PostgreSQL, такие как механизм распределённого управления транзакциями, глобальные сервисы, обработчик распределённых SQL-запросов, дополнительные метаданные, инструменты для управления кластером, развёртывания кластера и упрощения переноса в него существующих систем.
Патчи добавляют в ядро PostgreSQL распределённый вариант механизма управления параллельным доступом к данным при помощи многоверсионности (MVCC, Multiversion concurrency control) для разных уровней изоляции.
Большая часть функциональности PolarDB вынесена в расширения, что снижает зависимость от PostgreSQL и упрощает обновление и внедрение решений на базе PolarDB (упрощается переход на новые версии PostgreSQL и поддержание полной совместимости с PostgreSQL). Для управления кластером применяется инструментарий pgxc_ctl, основанный на аналогичной утилите от PostgreSQL-XC и PostgreSQL-XL. В кластере выделяется три базовых компонента: узлы БД (DN), менеджер кластера (CM) и сервис управления транзакциями (TM).
Дополнительно может быть задействован прокси-балансировщик нагрузки.
Каждый из компонентов является отдельным процессом и может быть запущен на разных физических серверах. Узлы БД обслуживают SQL-запросы от клиентов и одновременно выступают координаторами распределённого выполнения запросов с участием других узлов БД. Менеджер кластера отслеживает состояние каждого узла БД, хранит конфигурацию кластера и предоставляет инструменты для управления, резервного копирования, балансировки нагрузки, обновления, запуска и остановки узлов. Сервис управления транзакциями отвечает за поддержание общей целостности во всём кластере.
div align="center">
PolarDB for PostgreSQL
阿里云自主研发的云原生数据库产品
English | 简体中文
什么是 PolarDB for PostgreSQL
PolarDB for PostgreSQL(下文简称为 PolarDB)是一款阿里云自主研发的云原生数据库产品,100% 兼容 PostgreSQL,采用基于 Shared-Storage 的存储计算分离架构,具有极致弹性、毫秒级延迟、HTAP 的能力。
- 极致弹性:存储与计算能力均可独立地横向扩展。
- 当计算能力不够时,可以单独扩展计算集群,数据无需复制
- 当存储容量或 I/O 不够时,可以单独扩展存储集群,而不中断业务
- 毫秒级延迟:
- WAL 日志存储在共享存储上,RW 到所有 RO 之间仅复制 WAL 日志的元数据
- 独创的 LogIndex 技术,实现了 Lazy 回放和 Parallel 回放,最大程度地缩小了 RW 和 RO 节点间的延迟
- HTAP 能力:基于 Shared-Storage 的分布式并行执行框架,加速在 OLTP 场景下的 OLAP 查询。一套 OLTP 型的数据,可支持 2 套计算引擎:
- 单机执行引擎:处理高并发的 TP 型负载
- 分布式执行引擎:处理大查询的 AP 型负载
PolarDB 还支持时空、GIS、图像、向量、搜索、图谱等多模创新特性,应对企业对数据处理日新月异的需求。
分支说明
为稳定分支,持存储计算分离的云原生形态。
分支支持分布式形态。
产品架构
PolarDB for PostgreSQL 采用了基于 Shared-Storage 的存储计算分离架构。数据库由传统的 Share-Nothing 架构,转变成了 Shared-Storage 架构。由原来的 N 份计算 + N 份存储,转变成了 N 份计算 + 1 份存储。虽然共享存储上数据是一份,但是数据在各节点内存中的状态是不同的,需要通过内存状态的同步来维护数据的一致性;同时主节点在刷脏时也需要做协调,避免只读节点读取到超前的 “未来页面”,也要避免只读节点读取到过时的没有在内存中被正确回放的 “过去页面”。为了解决该问题,PolarDB 创造性地设计了 LogIndex 数据结构来维护页面的回放历史,该结构能够实现主节点与只读节点之间的同步。
在存储计算分离后,I/O 单路延迟变大的同时,I/O 的吞吐也变大了。在处理分析型查询时,仅使用单个只读节点无法发挥出存储侧的大 I/O 带宽优势,也无法利用其他只读节点的 CPU、内存和 I/O 资源。为了解决该问题,PolarDB 研发了基于 Shared-Storage 的并行执行引擎,能够在 SQL 级别上弹性利用任意数目的 CPU 来加速分析查询,支持 HTAP 的混合负载场景。
详情请查阅 产品架构。
快速部署
如果您已安装 Docker,那么可以从 DockerHub 上拉取 PolarDB for PostgreSQL 的 本地存储实例镜像,创建、运行并进入容器,然后直接使用 PolarDB 实例:
# 拉取单节点 PolarDB 镜像docker pull polardb/polardb_pg_local_instance# 创建运行并进入容器docker run -it --rm polardb/polardb_pg_local_instance psql# 测试实例可用性postgres=# SELECT version(); version-------------------------------- PostgreSQL 11.9 (POLARDB 11.9)(1 row)
对于更多进阶部署方式,请移步在线文档中的 进阶部署。在部署前,了解 PolarDB for PostgreSQL 的 架构简介 能够深化对每个步骤的理解。
开发
参考 开发指南 进行源码编译和开发。
文档
请移步本项目的 在线文档网站 查阅完整文档。
如果需要在本地预览或开发文档,请参考 贡献文档。
参与贡献
我们诚挚欢迎社区参与 PolarDB for PostgreSQL 的贡献,无论是代码还是文档。
以下是贡献者列表(由 contrib.rocks 支持):
软件许可
PolarDB for PostgreSQL 的源代码遵循 Apache 2.0 许可证,基于遵循 PostgreSQL 许可证的 PostgreSQL 开发。其中还包含了部分遵循其它开源许可证的第三方组件。请移步 LICENSE 和 NOTICE 了解更多信息。
致谢
部分代码和设计思路参考了其他开源项目,例如:PG-XC/XL (pgxc_ctl)、TBase (部分基于时间戳的 vacuum 和 MVCC)、Greenplum 以及 Citus (pg_cron)。感谢以上开源项目的贡献。
加入社区
-
PolarDB PostgreSQL Slack:https://app.slack.com/client/T023NM10KGE/C023VEMKS02
-
使用钉钉扫描如下二维码,加入 PolarDB 技术推广组钉钉群
Copyright © Alibaba Group, Inc.