fbpx

視覺化流程、資料清洗、自動數據分析…6 個 Dataiku 超強資料準備功能介紹!

資料準備通常是分析中最乏味的步驟,卻耗掉分析師大部分的時間。無論你是對資料準備樂此不疲的陣營,還是不想再清理任何一個資料集的陣營,Dataiku 的資料準備功能,就是為了讓資料準備更有效率(而且不那麼討厭)。

我們整理了 6 個 Dataiku 最受歡迎的功能:   

1.視覺化流程,業務單位與資料科學團隊更輕易協作

業務單位夥伴或數據團隊看到分析結果後,常常會想知道這些結果是怎麼產生的。

但是,解釋你如何使用表單和資料準備工具,對資料集進行各種操作,包括資料集整理、資料轉換和清理,是非常困難的。

使用 Dataiku,可以透過視覺化流程顯示資料流程的每個步驟,你可以向利害關係人解釋這些資料是如何轉換與使用,這有助於他們理解分析背後的步驟,從而讓他們對分析結果更有信心。 

Dataiku Visual Flow

Dataiku 的視覺化流程中,可以看到資料管道的每個步驟以便理解

2. 任何數據源及語言,資料轉換 (DATA TRANSFORMATIONS) 都能加速數據整理、清理和轉換

Dataiku 有豐富的表格功能,且容易在大型數據集上執行。Dataiku 提供 100 多種內建的視覺化數據轉換工具,可以快速清理、加入、聚合、重塑、篩選、地理編碼等。你還可以在執行函數之前查看每個資料轉換的預覽結果。此外,每個資料轉換都會個別列出,並且可以分組和標記,以便你(和其他人)全面了解到底發生了甚麼事情。

如果你需要或你想要,你還可以選擇以熟悉的語言編寫自定義公式,並為定制轉換 (bespoke transformations) 編寫代碼(使用 SQL 及其他語言)。你可以自由選擇,使用視覺化工具更快完成工作或自己寫代碼以確保更好的靈活性。

資料準備畫面

Dataiku 資料準備示意圖

3. 內建資料連接器,輕鬆連接資料源

Dataiku 有數十種資料連接器,可以輕鬆存取你需要的資料,這些連接器可以串接雲端、地端資料庫和企業的應用程式,以充分利用 Dataiku 的資料準備工具。無論從哪裡提取資料,資料都會統一呈現在常見的表格視圖中,非常適合習慣使用表格資料準備工具的分析師。按這裡查看支援的連接器列表。 

4. 原生的數據視覺化和統計分析

在資料準備的任何步驟中,你都可以利用 25 多種類型的內建圖表和視覺化統計分析,快速探索資料並找出資料的模式,完全不用將數據導到其他工具中。然後,你可以在同一個介面中,創建和部署 ML 模型、製作自動化報表與儀表板。

geospatial visualizations in Dataiku

Dataiku 的地理資料視覺化

statistical analysis

Dataiku 可以根據你的資料,提供統計分析的建議

5. 共享和分享工作成果以節省時間

Dataiku 的資料準備功能,例如「可共享」和「可分享」的項目資產,可以輕鬆找到並轉移之前的工作成果。你可以複製貼上過去的設定、將工作流程打包為可共用的視覺化組件,並選擇你要的參考資料,發佈到中央功能儲存區 (central feature store) — 以節省時間並實現最佳實踐。

Dataiku's feature store

Dataiku 的功能儲存區,可以保存和共用資料科學或分析項目

6. 自動化資料準備流程,大幅降低重複步驟

通常,利害關係人想看的資料準備流程都差不多,導致常常需要準備重複的報告。使用 Dataiku,這些常見的重複報告任務就可以自動執行。 

automate recurring data prep tasks

自動執行重複的資料準備任務

本文翻譯自: Top Data Preparation Software Features in Dataiku

相關文章