Related Posts
Greenplum 是一種建立在 PostgreSQL 基礎上的大規模平行(MPP)資料倉儲。Greenplum 能夠輕易地針對 PB 級資料,提供高效、快速的分析,使用者只需透過 SQL 語法,就能控制和查看伺服器叢集上的資料。另外,Greenplum 是混合 OLTP + OLAP 的 HTAP 架構,因此能執行複雜的資料查詢,也同時適合作為 BI 系統以及報表工具。
如何在 Pivotal Greenplum Database 擴充節點,及擴容常見問題列表及注意事項
VMware 已經發布了 PXF 6.2.1 和 GPText 3.8.1,它們在最新的 VMware Tanzu Greenplum 版本 (5.29.2 和 6.19.0) 中已經可以使用。這兩個版本將 Apache Log4J 組件更新到 2.16.0,解決 CVE-2021-44228 和 CVE-2021-45046。如果您無法升級到 PXF 6.2.1 或 GPText 3.8.1,請參考原廠建議的解決方法來降低此漏洞的風險。
Conversant需要快速分析資料來幫助操作,Pivotal Greenplum的MPP結構讓它可以水平擴展,而不是像其它資料庫縱向發展,只需要將更多商品節點加到Greenplum群集中,Conversant就能輕易的擴展平台來容納不斷成長的資料量,資料分佈在群集中以進行分析,從而提高了運行的速度和效率。
對於使用 Pentaho (或者類似產品Kettle / Hop) 這類 ETL 工具的開發人員來說,總有一些藏在角落、鮮為人知的方便功能。筆者在此將講解有關 Pentaho 流程中, Merge join 與Multiway merge join 的資料合併做法。
本文作者:Ren 測試一 1.先進行de…
GPFDIST 是 Greenplum Database parallel file distribution program,專門用於處理 Greenplum 對外部檔案進行讀取或寫。由於 GreenPlum 將自身定位為可處理 PB 等級資料的數據倉儲產品,因此在實際應用場景中,必然會有 ETL 大量資料匯入的需求,此時就可以透過 GPFDIST 以平行處理、協同作業的方式進行極為快速的資料處理。
為了解決現有系統運行上的各種難題,數位服務部門決定將所有執行在 Oracle WebLogic 上的應用系統,全面移轉至 Pivotal tc Server 之上。
不論是在開發、測試、驗證或是正式環境,tc Server 其輕量的特性、經過驗證的穩定性、快速部署的彈性,都足以滿足各項關鍵應用的要求。
本文作者:Ren 步驟如下: 1.查Re…
儘管 Table input 和 Execute SQL script 兩者都支援填寫 SQL 語句,但固定條件值的頻繁調整卻會降低 ETL 流程效率。為此,Pentaho 允許將 SQL 語句設定為「動態內容」,使流程轉為更靈活的函式結構,並在 SQL 查詢中引入「動態內容」,本文將對此做法進行詳細說明。
在不到兩年的時間裡,Southwest IT 全面虛擬化的比例從 0% 上升到 40%,這將配置服務器的時間從六天縮短到一小時。使用 Pivotal GemFire 來執行線上門戶等重要應用程式,而這些佔總業務的 80% 以上。Pivotal 使西南航空能夠推出受歡迎的社交媒體管道,每月訪問量高達數百萬。
Greenplum 能夠將資料存入 AO 表,而 PostgreSQL 這種資料庫工具,與傳統的查詢計劃器相比,更具有查詢計畫的優勢。Greenplum 使用列式儲存的方式儲存資料,它的邏輯是將資料儲存至行與列中,因為這種特性, Greenplum 能夠壓縮所有使用在關聯式資料庫中的 AO 表。
Ren 創建一個角色Ren,使其能夠存取…
企業收集數據的一直在變化,資料庫如何在每次數據更改時做出反應,而無需更改修改數據的應用程序呢? 本次活動分享如何以 Greenplum 整合 Debezium CDC 技術,打造成近實時的流數據處理。
Greenplum 平台擴展框架 (Platform Extension Framework, PXF) 是實現異質資料源、並行且高吞吐量的資料查詢連接器 (connector),讓 Greenplum 能快速的查詢外部數據,包含 Hadoop、PostgreSQL、Hive、MySQL、Oracle 等,透過 PXF 進行跨平台的資料查詢,不需要事先提取資料,也不需要執行效能較差且複雜的查詢語法,讓資料的查詢流程更容易、迅速。


