マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】Pentaho

【OSS情報アーカイブ】Pentaho

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

コンテンツ

「Pentaho」とは

「Pentaho」基本情報

■概要

Pentaho(ペンタホ)とは、BI(Business Intelligence)に必要なすべての機能が用意されているプロフェッショナル向けのオープンソースBIスイート製品です。

■BI(Business Intelligence)製品とは

「企業内の膨大なデータ」や「企業外の事実に基づくデータ」などの膨大なデータに対して、組織的かつ系統的に蓄積/分類/検索/分析/加工して、ビジネス上の各種意思決定に有用となる知識や洞察を生み出すという概念や仕組みを意味します。

■基本説明

Pentahoは、ETL、OLAP、クエリー&レポーティング、インタラクティブ分析、ダッシュボード、データマイニング、BIプラットフォームなどのBIのためのあらゆる機能を網羅しているBIオールインワンパッケージです。データ統合から分析までを一貫して行うことができます。

商用BI製品と同等の機能と性能を提供しています。

各機能ごとに、GUIが用意されているため、複雑なロジックを作成せずに、各機能を使用することができます。

ビッグデータ統合のための接続部品が豊富に揃っています。高速/分散処理アーキテクチャHadoopと連携することができるため、大規模データも短時間で処理できます。

■オフィシャルサイト情報

オフィシャルサイト

→Pentaho

ライセンス情報

Pentahoは、開発コミュニティによって提供される無償版「Community Edition」と、Pentaho社が販売する機能拡張した有償版「Enterprise Edition」があります。

Pentaho(Community Edition)のライセンスは「the GNU General Public License」です。

詳細について、こちらを参照ください。
→Hitachi Vantara →Hitachi Vantara Software License Terms

ダウンロード

→SOURCEFORGE →Hitachi Vantara | Pentaho

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Zabbix」など。

「Pentaho」の主な機能

■データ統合機能

直感的なドラッグ&ドロップ操作で、さまざまなオブジェクトを組み合わせて、データ変換とジョブを作成し、DWH(データウエアハウス)を構築できます。

■アナライザー機能

作成されたDWH(データウエアハウス)に対して、多次元分析データ項目のドラッグ&ドロップでOLAP分析対象を指定できます。スライス、ドリルダウンのような分析軸の変更も可能です。

「Weka」や「R」のようなデータマイニングツールとの連携もサポートされています。ビッグデータに対しても、有効的な分析ができます。

■インタラクティブ分析

高速ROLAP(リレーショナルOLAP)エンジン「Mondrian」が多次元分析を可能にします。直感的操作により、欲しい情報をスピーディに表示できます。

■レポーティング機能

データ分析結果をレポートとして出力できます。レポートフォーマット定義画面へのドラッグ&ドロップによってレイアウト設定を行えます。

■ダッシュボード機能

モニタリングしたい情報について、リッチでインタラクティブな表示を行えます。

■Pentaho for Big Data MapReduce & Instaview

「MapReduce」開発のためのUIで、ビッグデータ分析のセルフサービス化機能です。

■データマイニング&予測分析機能

グラフィカルなインタフェースで、高度なデータマイニングを操作できます。膨大なデータから、法則性、相関関係、隠れたパターンを分析して発見するための機能です。

サンプル画面

■データ統合(ETL)

Pentahoデータ統合機能

■Pentahoアナライザー画面

Pentahoアナライザー画面

■Pentahoエンタープライズ レポーティング画面

Pentahoエンタープライズ レポーティング画面

■Pentahoダッシュボード画面

Pentahoダッシュボード画面

■Pentahoインタラクティブレポーティング画面

Pentahoインタラクティブレポーティング画面

■Big Dataプラットフォーム

Pentaho for Big Data MapReduce & Instaview

■データマイニング解析

Pentahoデータマイニング解析

Pentaho参考情報①Pentahoとは(入門編)

オープンソースBIスイート「Pentaho」の参考となるサイトについて紹介します。

■Pentahoブログ

概要

KSKアナリティクスによるPentahoに関するブログです。Pentahoに関する情報を中心として、最新情報や技術的情報を参照できます。

解説テーマ

・Pentaho7.0がリリースされました!
・Best Practice:Pentaho Data Integration Design Guidelines①
・インタラクティブレポート 日付の範囲でデータの絞り込み
・Pentaho社の東京オフィス開設
・GCPNEXT World Tour in Tokyo
・Pentahoにおけるキャッシュについて
・PentahoCE×Saikuハンズオン ③Saikuでレポート作成ならびにフィルタリング
・ユーザーコンソール上に登録されているキューブの一覧を取得
など

ページリンク

→オープンソースBIのPentaho(ペンタホ)ブログ

Pentaho参考情報②Pentahoのダウンロードとインストール

Pentahoの環境別インストール方法について紹介します。

■Linux(CentOS7)編

概要

「CentOS7」に「Pentaho: 5.3.0」をインストールする方法がまとめられています。「Community Edition」と「Enterprise Edition」の両方をインストールしています。

解説テーマ

・はじめに
・環境
・必要パッケージのインストール
・PentahoEEインストール
・自動起動設定
・MySQL JDBCのインストール
・アクセスしてみる
・おわりに

ページリンク

→Qiita →Memo: Pentaho BAサーバーインストール

■Windows編

概要

Windowsに「Pentaho Community Edition(Ver6)」をインストールする手順がまとめられています。

プラグインの利用方法についても解説されています。

解説テーマ

・Pentahoをダウンロードする
・Javaをセットアップする
・ダウンロードしたファイルを解凍
・Pentahoサーバを起動

[Plug-inの利用]
・CDF(Community Dashboards Framework)
・CDA(Community Data Access)
・CDE(Community Dashboard Editor)

ページリンク

→ぱーくん plus idea →Pentaho BIサーバ Community Edition(Ver6)をWindowsでインストールして動かしてみたよ

Pentaho参考情報③Pentahoの「Data Integration」とは

Pentaho参考情報③Pentahoの「Data Integration」とは

■「Pentaho Data Integration(Kettle)」概要

「Pentaho Data Integration(PDI)」とは、オープンソースのETLツールです。

ETLツールとは

・「ETL」は「Extract Transform Load」の略
・データについて「入力→変換→出力」を行うツール
・「変換」=「重複行排除」「列名前変更」「型変更」「データJOIN」など
・フローを可視化できるため管理が容易

「Pentaho Data Integration(PDI)」とは

・「Kettle」とも呼ばれる
・強力な「抽出」「変換」「ローディング(ETL)」機能を提供
・洗練されたユーザインターフェース
・直観的でグラフィカルなドラッグ&ドロップ設計環境
・画期的なメタデータ駆動型アプローチ
・PentahoのBIツール「Business Analytics Platform」とは独立して単独で利用できる
・データフロー定義ファイルはxml(git上で管理できる)

■「Pentaho Data Integration」オフィシャルサイト

概要

「Pentaho Data Integration(PDI)」のオフィシャルサイトです。各種公式情報を参照できます。

ページリンク

→Hitachi Vantara Community →Data Integration – Kettle

■「Pentaho Data Integration」概要解説

概要

「Pentaho Data Integration」などのツールを使用して、ETL処理を行なう一連の流れについて解説されています。

解説テーマ

[システムの概要]
・データ収集
・ETL処理
・BI
[主要技術紹介]
・Scrapy
・Pentaho Data Integration
・Tableau Public
[データ収集から変換、可視化、公開までの流れ]
・どういう問いに答えたいかを考える
・スキーマの全体像を作る
・データを収集する
・ETL処理を記述する
・データを分析する
・分析結果を公開する

ページリンク

→Qiita →Webページのスクレイピングと分析・可視化

■「Pentaho Data Integration」の使い方

概要

「Pentaho Data Integration」の使い方について「基本的な流れ」「各機能の使用方法」などについて解説されています。

解説テーマ

・データ変換の流れ
・基本的な使い方
・個別のアイコンの説明
・入力
・変換
・フロー
・結合
・出力
・その他

ページリンク

→Qiita →Pentaho Data Integration メモ

Pentaho参考情報④Pentahoの「Spoon」とは

Pentaho参考情報④Pentahoの「Spoon」とは

■Pentahoの構成

「Pentaho」は、複数のツール/Webアプリケーションが統合された総称を意味しています。

ETLツール「Pentaho Data Integraion(PDI)」=「Kettle」

Pentahoの中の1つの機能として、ETLツール「Pentaho Data Integraion(PDI)」があります。
・「Kettle」という別名
・「Kettle」=「Kettle Extraction Transformation Transportation & Loading Environment」

「Kettle」のコンポーネント

「Kettle」の配下にも複数のツール(コンポーネント類)が存在しています。
1.「Spoon(スプーン)」 ETLモデリングツール(GUI)
2.「Pan(パン)」 Transformationを実行(コマンドラインツール)
3.「Kitchen(キッチン)」 Jobを実行(コマンドラインツール)
4.「Carte(カルテ)」 Webサーバ(TransformationやJobを実行)

■「Spoon」とは

「Spoon」とは、ETLモデリングを行なうGUIアプリケーションです。

「Spoon」の主な機能

・データ抽出
・データ加工
・データエクスポート
・ジョブ定義
・ジョブ手動実行
・OLAP分析
・レポート作成 など

■Spoon DB→データ加工→Excel出力

概要

Spoonを使用して、データベース(PostgreSQL)からデータを抽出して、データ加工を行い、Excelファイルとして出力する方法についてまとめられています。

解説テーマ

・バイナリを入手する
・Spoonを起動する
・新しいTransformationを作成する
・新しいデータベース接続を追加する
・Transformationを編集する

ページリンク

→M12i. →PentahoのSpoonを起動してTransformationを編集する

■Spoon Salesforce→データ加工→Excel出力

概要

Spoonを使用して、Salesforceデータを取り込み、データ加工後、Excelファイルへエキスポートする手順についてまとめられています。

解説テーマ

・Pentaho(Spoon)でできること
・Pentaho(Spoon)のインストールと起動
・Salesforceへの接続
・Salesforce Inputの作成
・エクセルへの出力の作成

ページリンク

→ぱーくん plus idea TOP →PentahoのETLツール「Spoon」でSalesforceのデータをエクセルにエクスポートする

■Spoon csvファイル→データ加工→Elasticsearchへ一括登録

概要

Spoonを使用して、csvファイルを取り込み、Elasticsearchへ一括登録を行なう方法についてまとめられています。

解説テーマ

・はじめに
・PENTAHOとは?
・環境準備
・起動
・実行計画作成
・注意点
・まとめ

ページリンク

→Qiita →ElasticsearchにPDI (Spoon)を使って一括登録を行う方法

Pentaho参考情報⑤Pentahoの「Pentaho Reporting」とは

Pentaho参考情報⑤Pentahoの「Pentaho Reporting」とは

■「Pentaho Reporting」概要

「Pentaho Reporting」とは、オープンソースのレポートツールスイートです。

多種多様なデータソースからさまざまなレポートを作成できます。

「Pentaho Reporting」の構成

「Pentaho Reporting」は複数のツールで構成されています。
1.「Report Designer」 レポート作成用ビジュアルデザイン環境
2.「Reporting Engine」 組み込み用ライブラリ
3.「Reporting SDK」 サポートライブラリパッケージ

入力データ

さまざまなデータストアからの入力が可能です。データ出所やソースデータの結合方法に制限はありません。

出力形式

多くの出力形式に対応しています。
・PDF
・Excel
・HTML
・テキスト
・リッチテキストファイル
・XML形式 など

出力先

・ファイルとして保存
・電子メールで送信 など

他のアプリケーションに組み込み可能

「Pentaho Reporting」は、他のアプリケーションと統合できるレポートコンポーネントとして設計されています。

必要なコンポーネントだけを使用して、独自アプリケーションにレポーティング機能として組み込むことが可能です。

■「Pentaho Reporting」オフィシャルサイト

概要

「Pentaho Reporting」のオフィシャルサイトです。各種公式情報を参照できます。

ページリンク

→Hitachi Vantara Community →Pentaho Reporting

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【OSS情報】LLMトレーニング用ライブラリ「 GPT-NeoX 」📚

OSS情報

2024.07.18

【OSS情報】LLMトレーニング用ライブラリ「 GPT-NeoX 」📚

「 GPT-NeoX 」は、GPU上で大規模言語モデル(LLM)を効率的にトレーニングするためのライブラリです。NVIDIAのモデルを基に独自の最適化が加えられ、オートレグレッシブ言語モデルのトレーニング手法を集約しています。

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

ウェビナーまとめ

2024.05.15

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

2024年3月12日に三菱電機ITソリューションズ株式会社とアットストリームパートナーズ合同会社の共催で、組立加工製造業向けのセミナー「なぜか高くなる原価を管理する 不確実性の時代を乗り切るためのコスト戦略とは」が開催されました。本セミナーでは、製造業における原価管理の現状と改善手法について深く掘り下げ、経営活動への具体的な活用方法を提示しました。今回は、その講演の要点をお伝えします。

【OSS情報】WebベースAPI開発スイート「 Hoppscotch 」🌐

OSS情報

2024.07.04

【OSS情報】WebベースAPI開発スイート「 Hoppscotch 」🌐

「 Hoppscotch 」は、オープンソースのAPI開発エコシステムで、使いやすさとアクセシビリティを重視した軽量なWebベースのスイートです。無料版と有料版があり、PostmanやInsomniaの代替として利用可能です。