マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】H2O

【OSS情報アーカイブ】H2O

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「H2O」とは

「H2O」基本情報

■概要

H2O(エイチツーオー)とは、オープンソースの分散型インメモリマシン機械学習プラットフォームです。

■基本説明

H2Oは、ビッグデータに基づいて機械学習モデルを構築し、エンタープライズ環境でこれらのモデルを構築できる機械学習および予測分析プラットフォームです。

H2Oは「インメモリ高速処理」「分散型」「スケーラブル」の特徴を持ち、単一プラットフォームでオンラインのスコアリングとモデリングを可能にします。優れた予測モデリングにより、データからすばやく洞察を導き出すことができます。

■経緯

2011年 初版リリース

■ユースケース

H2Oはさまざまな機械学習用途に利用できます。
・高度な分析処理
・不正検出
・クレーム管理
・デジタル広告 など

■オフィシャルサイト情報

オフィシャルサイト

→H2O

ライセンス情報

H2Oのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。
→GitHub →h2oai / h2o-3 →LICENSE

ダウンロード

H2Oは「ビッグデータインフラストラクチャ」「ベアメタル」「Hadoopクラスタ」「Sparkクラスタ」などで動作します。

対応OS
・Windows
・OS X
・Ubuntu
・RHEL
・CentOS など

→H2O →Downloads →H2O

導入事例

H2Oプラットフォームは世界中で14000を超える組織で使用されており、R言語コミュニティやPythonコミュニティの両方で高い人気を保持しています。

→H2O →Customer Stories

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「‎TensorFlow」「Chainer‎」「Keras」など。

「H2O」の主な特徴

■分散キー/値ストア

H2Oの内部では「分散キー/値ストア」を使用して、すべてのノードやマシンにわたって「データ」「モデル」「オブジェクト」などにアクセスし参照します。

■分散型インメモリ機械学習

H2Oは大量データセットをサポートするため「分散システム」「インメモリコンピューティング」「ノードとクラスタ間の高速シリアル化」などの技術を利用して、きめ細かいインメモリマップ縮小を利用する並列アルゴリズムを使用して機械学習を加速させます。

■サポートアルゴリズム

H2Oは広く使用されている統計および機械学習アルゴリズムをサポートしています。
・ディープラーニング
・GBM(グラジエントブーストマシン)
・GLM(一般化線形モデル)
・DRF(分散ランダムフォレスト)
・Word2Vec など

→H2O →Algorithms

■デプロイ性

H2Oは「POJO(Plain Old Java Object)」および「MOJO」を使用して、モデルを迅速かつ簡単にプロダクションに展開できます。

「H2O」の主な機能

■データ取り込み機能

H2Oのデータパーサーには、受信データセットのスキーマを推測するためのインテリジェンスが組み込まれており、さまざまな形式の複数のソースからのデータ取り込みをサポートしています。
・HDFS
・Spark
・S3
・Azure Data Lake など

■対話型ユーザーインターフェース「H2O Flow」

H2O Flowは、H2O用のノートブックスタイルのオープンソースユーザーインターフェースです。

iPython Notebookと同様に「コード実行」「テキスト」「数学」「プロット」「リッチメディア」などを1つのドキュメントにまとめることができるWebベースの対話型環境です。

→H2O →Docs →Using Flow – H2O’s Web UI

■AutoML機能

H2OにはAutoML機能もあり、ユーザーが指定した制限時間内に多くのモデルの自動トレーニングおよび調整が可能です。

機械学習ワークフローの自動化に使用できます。

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【デジタル寺田の3分用語解説】 米「 TikTok 規制法」とは?🇺🇸

デジタル寺田の3分用語解説

2025.01.06

【デジタル寺田の3分用語解説】 米「 TikTok 規制法」とは?🇺🇸

米「 TikTok 規制法」は、国家安全保障の観点からTikTokを運営する中国企業「バイトダンス」に対して制定された規制です。この法案では、2025年1月19日までにバイトダンスがTikTokの米国事業を売却しない場合、アプリの配信や更新が禁止されます。

【デジタル寺田の3分用語解説】 「 EUサイバーレジリエンス法 」とは?🇪🇺

デジタル寺田の3分用語解説

2025.01.06

【デジタル寺田の3分用語解説】 「 EUサイバーレジリエンス法 」とは?🇪🇺

「 EUサイバーレジリエンス法 」は、サイバーセキュリティを強化するためにEUが制定した法案で、サイバー攻撃の増加に対応するためにデジタル製品のセキュリティ対策を義務付けることを目的としています。ネットワークに接続されるすべてのデジタル製品が対象となりますが、一部の製品は除外されます。

【デジタル寺田の3分用語解説】 OpenAIの動画生成AI「 Sora 」とは?🌌

デジタル寺田の3分用語解説

2025.01.06

【デジタル寺田の3分用語解説】 OpenAIの動画生成AI「 Sora 」とは?🌌

OpenAIが開発した次世代動画生成AI「 Sora 」は、日本語の「空」から名付けられ、無限の可能性を象徴する技術として注目されています。テキスト入力のみでリアルな動画を生成できる点が特徴で、例えば「犬が海辺を走る」といったプロンプトを入力すると、それをそのまま映像化します。