Related Posts

印度身分識別管理局(UIDAI)導入 Hitachi Vantara 的 Pentaho 作為解決方案,創建適合各種數據源和數據類型的大數據架構,並利用大量數據進行多重驗證,以支持政府數據集。UIDAI 藉由 HCL Infosystems Ltd. 的分銷和 IT 服務與 GrayMatter Software Services Pvt. 從數據的應用和訊息流中執行關鍵的驗證和分析。

” Pentaho’s in…

本次研討會將介紹 Apache Hop,以及比較 Pentaho、Apache Hop 兩者差異。趕快報名,一起來認識 Apache Hop 這個明日之星吧!

政府機構與多數組織藉由 Pentaho 商業分析與資料整合平台,利用公部門資料來提高效率、極大化感測器資料值並支援關鍵計劃,有效整合、管理、分析以運用至各層面,例如提高營運效率、透過物聯網(IoT)提供主動智能、運用大數據對抗安全威脅等。

Pentaho Data Catalog 可以自動尋找、分析和標記結構化和非結構化資料,並將商業術語和資料治理策略結合,協助企業開啟資料治理的第一步。Pentaho 原廠講師將介紹資料治理/資料目錄、如何構建資料目錄、Pentaho Data Catalog 應用案例、Reference Data Management 等內容。

分享如何建立數據驅動文化 (DataOps),藉由數據協作、流程自動化、metadata 和端到端的設計思維,幫助企業更好的掌握數據、提升數據品質、安全以及合規性。

Pentaho 6.1版本,為IT專業人員提供更多的陣列(array)運算選項,在使用Pentaho Data Integration時能更好控制複雜邏輯運算。此外,Pentaho推出新的自助服務數據上線藍圖,此產品使企業用戶和客戶無需IT輔助即可加載多樣化的資料來源。

儘管 Table input 和 Execute SQL script 兩者都支援填寫 SQL 語句,但固定條件值的頻繁調整卻會降低 ETL 流程效率。為此,Pentaho 允許將 SQL 語句設定為「動態內容」,使流程轉為更靈活的函式結構,並在 SQL 查詢中引入「動態內容」,本文將對此做法進行詳細說明。

對於使用 Pentaho (或者類似產品Kettle / Hop) 這類 ETL 工具的開發人員來說,總有一些藏在角落、鮮為人知的方便功能。筆者在此將講解有關 Pentaho 流程中, Merge join 與Multiway merge join 的資料合併做法。

“Using Pentaho…

當前支援的 Pentaho 版本中不存在此漏洞,因為預設情況下沒有使用易受攻擊的類別(Classes)。但是為了響應最近發布的 CVE-2021-44228 漏洞,Hitachi Vantara 的資訊團隊對已發布的軟體 (包括 Pentaho) 進行了測試。

本文會介紹 SAS EG 的內建排程功能,再往下延伸 2 種結合 ETL 工具如 Trinity 來執行 SAS 軟體的 vbs 及 sas 2 種檔案的排程設定,最後透過 Trinity 環境將上文提到的兩種需求呈現出來。

“PDI is a low-…

“Our franchise…

透過 Hitachi Vantara 的 Pentaho 平台簡化整個機器學習工作流程,包含資料準備和特徵工程,定期更新模型,訓練、調整和測試模型,部署和操作模型。Pentaho 資料整合 (PDI) 及其分析功能在複雜的資料環境中部署機器學習模型,整合各種機器學習、深度學習語言、套裝軟體。