マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】Pentaho Data Integration

【OSS情報アーカイブ】Pentaho Data Integration

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「Pentaho Data Integration」とは

概要

Pentaho Data Integration(ペンタホデータインテグレーション)はETLツールです。革新的なメタデータ駆動型アプローチを使用して、強力な「データ抽出」「データ変換」「データ読み込み」などを実行できます。開発経緯から「Kettle」とも呼ばれます。

基本説明

Pentaho Data Integration(PDI)(Kettle)は、「変換構築」「ジョブスケジュール」などを実行できるETLデスクトップアプリケーションです。

「直感的でグラフィカルなドラッグアンドドロップ設計環境」と「実績のあるスケーラブルな標準ベースアーキテクチャ」を備えたPDIは、「キャプチャ」「クレンジング」「保存プロセス」などのデータに関する操作をシンプルに実行できます。

開発経緯

Pentahoが、PDIのベースとなったKettle(Kettle Extraction Transformation Transport LoadEnvironment)を買収した時に「Pentaho Data Integration」に改名されました。

ユースケース

・異なるデータベースおよびアプリケーション間のデータ移行
・巨大データセットをデータベースにロード
・範囲ステップによるデータクレンジング
・PentahoReportingのデータソースとしてリアルタイムETLを活用する機能を含むデータ統合
・データウェアハウス構築—少しずつ変化するディメンションと代理キー作成に対するサポート など

オフィシャルサイト情報

■オフィシャルサイト

→community.hitachivantara.com →data-integration-kettle

■GitHub

→github.com →pentaho/pentaho-kettle

■主要開発元

Pentaho Data Integrationは、community.hitachivantara.comが中心となり開発が進められています。

→community.hitachivantara.com

■ライセンス情報

Pentaho Data Integrationのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。
→github.com →pentaho/pentaho-kettle →LICENSE.txt

■動作環境

「Linux」「Windows」「MacOS」がサポートされています。

■ダウンロード

→github.com →pentaho/pentaho-kettle

同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Talend Open Studio」など。

変換機能

PDIの変換は、ステップと呼ばれる論理的なタスクのネットワークであり、データフローとして表現されます。

ジョブ機能

PDIのジョブは、ETLアクティビティの「リソース」「実行」「依存関係」を調整するためのワークフローのようなモデルです。

個々の機能を集約してプロセス全体を実装します。

Pentahoリポジトリ

Pentahoリポジトリは、ジョブと変換の保存と管理に加えて、完全なリビジョン履歴を提供します。

チームで共同ETL環境が必要な場合は、Pentahoリポジトリの使用が推奨されています。

プラグイン機能

コアプラグインとして各種プラグインが提供されています。

→github.com →pentaho/pentaho-kettle →plugins

負荷分散機能

PDIは、トランスフォーメーションクラスタリングを使用する場合に、トランスフォーメーション内および複数クラスタノードにわたるデータ負荷分散機能を提供します。

ロギング機能

ロギングは、「挿入されたレコード数」「変換に費やされた合計経過時間」など、ジョブや変換に関する要約情報を提供します。

また、例外やエラーなどの「デバッグ詳細情報」も提供します。

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【トレンド解説】米国における「 生成AI活用 」最新動向📈

トレンド解説

2024.05.07

【トレンド解説】米国における「 生成AI活用 」最新動向📈

「米国における 生成AI活用 最新動向」について解説しています。生成AIは日本企業にも多くの可能性をもたらし、「デスクワークの効率化」や「業務の自動化推進」に貢献しています。生成AIを理解し、活用することが、グローバルな競争力を高める鍵となります。

【ChatGPT探訪】「 無限議論 」〜最強スタンド考察〜🤔

ChatGPT探訪

2024.05.07

【ChatGPT探訪】「 無限議論 」〜最強スタンド考察〜🤔

マジセミSNSに投稿した 【担当者A】の「 無限議論 」〜最強スタンド考察〜💬 を記事化したものです。 ChatGPTに課金していないみなさんにも、 AI同士の議論をお楽しみいただけます👍 ※原稿テキストを放り込むだけで、 ジョジョ風イラストを作成してしまう生成AIがすごくないですか?

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

ウェビナーまとめ

2024.05.15

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

2024年3月12日に三菱電機ITソリューションズ株式会社とアットストリームパートナーズ合同会社の共催で、組立加工製造業向けのセミナー「なぜか高くなる原価を管理する 不確実性の時代を乗り切るためのコスト戦略とは」が開催されました。本セミナーでは、製造業における原価管理の現状と改善手法について深く掘り下げ、経営活動への具体的な活用方法を提示しました。今回は、その講演の要点をお伝えします。