マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】Apache NiFi

【OSS情報アーカイブ】Apache NiFi

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「Apache NiFi」とは

基本情報

概要

Apache NiFi(アパッチナイファイ)とは、データフローオーケストレーションツールです。Webインタフェースでシステム間のデータフロー自動化定義が可能です。IoTデータフローを見据えた双方向性が特徴です。

基本説明

Apache NiFiは、フローベースプログラミングコンセプトでのデータ処理/配信システムです。

スケーラブルデータフローを有向グラフとして定義し、データのルーティング/変換/中間ロジックを組み合わせて定義できます。グラフィカルなWebインタフェース上でストリーム処理データフローの定義/動作を行えます。

データフロー管理自動化のための容易さ/拡張性/信頼性が特徴です。

経緯

米国家安全保障局(NSA)が開発していた「Niagrafiles」がベースになっています。

2014年11月、Apache Software Foundationにオープンソースとして寄贈
2015年7月、ApacheのTopレベルプロジェクトに昇格

主な特徴

WebベースUI

WebベースUIで、データフローの設計/制御/フィードバック/モニタリングの各機能を直感的に操作できます。

フローのリアルタイム反映

WebUI上のデータフローを変更した時点で、変更内容がリアルタイムに反映されます。リアルタイムデータロジスティックスの統合的/インタラクティブな制御が可能です。

設定柔軟性

「信頼性」「速度(低レイテンシ/高スループット)」「動的な優先順位付け」などの調整を柔軟に設定できます。

セキュア

「暗号化方式(SSL/SSH/HTTPSなど)サポート」でアクセス経路の暗号化を行い、「プラガブルロールベース認証/認可」で役割ベースの認証ができるなど、各種セキュア機構を備えています。

可用性

「処理可能な量以上にデータが取得されたケースへの対応」や「システム障害への対応」などにも対策できます。

クラスタリング

複数ノード上にスケールアウトし、性能を高められる構成になっています。シンプルなマスタスレーブクラスタリング構成です。

1ノードのスループットが100MB/sであったとしても、ノードを重ねればGB単位のスループットを達成できます。

ハードウェアリソース

NiFiの設計方針として、動作しているサーバ上の性能を使い切るように作られており、特にCPU/Diskに負荷がかかる処理モデルとなっています。

メッセージの処理保証

メッセージの処理保証は「Content Repository」のWAL方式の出力によって効果的に達成されます。

データフローの最初(データの発生元)から最後までトラッキングし、データフローの一貫した追跡が可能です。コンプライアンス/トラブルシューティング/最適化などに利用できます。

データバッファリング

データのバッファリングをサポートしており、特定容量/保存期間に応じたバックプレッシャーが可能です。

履歴ローリングバッファ

NiFiの「content repository」は履歴のローリングバッファとして動作します。保存期間超過/処理完了時/容量不足時などに削除されます。

拡張性

さまざまな拡張を行えます。高速な開発と容易なテストが可能です。

双方向性

「Apache NiFi」は、双方向/ポイントツーポイントの通信を行う特徴があります。従来型単方向ストリーミング「Apache Storm」「Spark Streaming」とは異なる部分です。

「IoTセンサ同士の通信」などにも対応できるように設計されています。

プロダクト連携

「Apache Hadoop」「Apache Spark」「Apache Storm」「SAP HANA」と連携し保存/分析できます。

「Oracle」「Teradata」「MongoDB」「Apache Hbase」「Apache Cassandra」などにも対応します。

同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「RapidMiner Studio」「Talend Open Studio」「Pentaho」など。

ライセンス情報

Apache NiFiのライセンスは「Apache License Version 2.0」です。このライセンスに従うことを条件として、ソースコードの改変と公開が許可されています。

ダウンロード

ダウンロードページ

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

「 VMWare 」の仮想化技術は、「ITインフラの効率化」に大きく貢献する技術ですが、Broadcomによる買収後のライセンス変更が大きな問題として注目されています。柔軟で慎重な契約見直しが今後の鍵となります。

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

経済産業省による「 生成AI 利活用ガイドブック 」は、企業やクリエイター向けに、安心して「生成AI」を利用するための、「指針」「実例」「注意点」を明示しています。「業務効率化」や「新しいアイデア創出」の支援を目的としています。

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

「 2029年問題 」とは、高校でのデジタル教育改革により、新入社員と既存社員間でデジタルスキル格差が拡大する懸念を指します。企業は早急に対応が求められています。この格差は、企業競争力や業務効率にも、影響を及ぼす可能性があります。