マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】H2O

【OSS情報アーカイブ】H2O

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「H2O」とは

「H2O」基本情報

■概要

H2O(エイチツーオー)とは、オープンソースの分散型インメモリマシン機械学習プラットフォームです。

■基本説明

H2Oは、ビッグデータに基づいて機械学習モデルを構築し、エンタープライズ環境でこれらのモデルを構築できる機械学習および予測分析プラットフォームです。

H2Oは「インメモリ高速処理」「分散型」「スケーラブル」の特徴を持ち、単一プラットフォームでオンラインのスコアリングとモデリングを可能にします。優れた予測モデリングにより、データからすばやく洞察を導き出すことができます。

■経緯

2011年 初版リリース

■ユースケース

H2Oはさまざまな機械学習用途に利用できます。
・高度な分析処理
・不正検出
・クレーム管理
・デジタル広告 など

■オフィシャルサイト情報

オフィシャルサイト

→H2O

ライセンス情報

H2Oのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。
→GitHub →h2oai / h2o-3 →LICENSE

ダウンロード

H2Oは「ビッグデータインフラストラクチャ」「ベアメタル」「Hadoopクラスタ」「Sparkクラスタ」などで動作します。

対応OS
・Windows
・OS X
・Ubuntu
・RHEL
・CentOS など

→H2O →Downloads →H2O

導入事例

H2Oプラットフォームは世界中で14000を超える組織で使用されており、R言語コミュニティやPythonコミュニティの両方で高い人気を保持しています。

→H2O →Customer Stories

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「‎TensorFlow」「Chainer‎」「Keras」など。

「H2O」の主な特徴

■分散キー/値ストア

H2Oの内部では「分散キー/値ストア」を使用して、すべてのノードやマシンにわたって「データ」「モデル」「オブジェクト」などにアクセスし参照します。

■分散型インメモリ機械学習

H2Oは大量データセットをサポートするため「分散システム」「インメモリコンピューティング」「ノードとクラスタ間の高速シリアル化」などの技術を利用して、きめ細かいインメモリマップ縮小を利用する並列アルゴリズムを使用して機械学習を加速させます。

■サポートアルゴリズム

H2Oは広く使用されている統計および機械学習アルゴリズムをサポートしています。
・ディープラーニング
・GBM(グラジエントブーストマシン)
・GLM(一般化線形モデル)
・DRF(分散ランダムフォレスト)
・Word2Vec など

→H2O →Algorithms

■デプロイ性

H2Oは「POJO(Plain Old Java Object)」および「MOJO」を使用して、モデルを迅速かつ簡単にプロダクションに展開できます。

「H2O」の主な機能

■データ取り込み機能

H2Oのデータパーサーには、受信データセットのスキーマを推測するためのインテリジェンスが組み込まれており、さまざまな形式の複数のソースからのデータ取り込みをサポートしています。
・HDFS
・Spark
・S3
・Azure Data Lake など

■対話型ユーザーインターフェース「H2O Flow」

H2O Flowは、H2O用のノートブックスタイルのオープンソースユーザーインターフェースです。

iPython Notebookと同様に「コード実行」「テキスト」「数学」「プロット」「リッチメディア」などを1つのドキュメントにまとめることができるWebベースの対話型環境です。

→H2O →Docs →Using Flow – H2O’s Web UI

■AutoML機能

H2OにはAutoML機能もあり、ユーザーが指定した制限時間内に多くのモデルの自動トレーニングおよび調整が可能です。

機械学習ワークフローの自動化に使用できます。

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【デジタル寺田の3分用語解説】 「 心理的安全性 」が無い職場とは?🤐

デジタル寺田の3分用語解説

2025.03.17

【デジタル寺田の3分用語解説】 「 心理的安全性 」が無い職場とは?🤐

「 心理的安全性 」が低い職場とはどのような環境なのか、具体的な特徴を解説します。「質問しづらい雰囲気」「失敗を報告できない隠蔽体質」「発言をためらう風土」など、心理的安全性の欠如がもたらす影響を詳しく紹介し、安全な職場づくりの重要性も解説します。

【デジタル寺田の3分用語解説】 「 AIエージェント 」は、人間の管理職の代わりになるか?🤖

デジタル寺田の3分用語解説

2025.03.11

【デジタル寺田の3分用語解説】 「 AIエージェント 」は、人間の管理職の代わりになるか?🤖

「 AIエージェント 」は営業マネージャーの業務をどこまで代行できるのか?「データ分析」「フィードバック」「自動日程調整」の可能性を探り、未来の管理職のあり方を考察します。AIが進化する中で、人間の役割はどう変わるのか詳しく解説します。

【デジタル寺田の3分用語解説】 「 動画SEO 」とは?▶️

デジタル寺田の3分用語解説

2025.04.21

【デジタル寺田の3分用語解説】 「 動画SEO 」とは?▶️

BtoBマーケティングで注目される「 動画SEO 」について、「視聴維持率やユーザーリアクションを高めるポイント」「YouTube動画検索で上位表示を狙うための動画SEOの基本テクニック」「高品質コンテンツ制作」「先行者優位で第一想起を獲得する戦略」を紹介します。