マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】RapidMiner Studio

【OSS情報アーカイブ】RapidMiner Studio

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「RapidMiner Studio」とは

「RapidMiner Studio」基本情報

■概要

RapidMiner Studio(ラピッドマイナースタジオ)とは、ビジュアルデータサイエンスワークフローデザイナーです。統合型データ分析プラットフォーム「RapidMiner」に含まれています。

■基本説明

RapidMiner Studioは、「アイデアのラピッドプロトタイピング」や「ミッションクリティカルな予測モデルの設計」などデータサイエンティストの生産性を高めるビジュアルデータサイエンスワークフローデザイナーです。

「機械学習」「データマイニング」「テキストマイニング」「特徴選択」「予測分析」などのさまざまなデータ分析処理をプログラミングなしで実施できます。

データサイエンスと機械学習をアナリティクスチーム全体にもたらすビジュアルワークフローデザイナとして、強力で直感的なグラフィカルユーザーインターフェースを提供します。

■主要開発元

RapidMiner Studioは、米国RapidMiner社が中心となり開発しています。

→RapidMiner →COMPANY →About Us

■ユースケース

RapidMiner Studioは、研究分野/教育分野/産業分野において、以下のようなさまざまな分析処理用途に活用できます。
・機械故障予測
・購買履歴データによる離反顧客予測/商品推薦
・クレーム要因特定
・予測保守
・詐欺行為検出
・ラピッドプロトタイピング
・ソフトウェア開発 など

■オフィシャルサイト情報

オフィシャルサイト

→GitHub →rapidminer/rapidminer-studio

ライセンス情報

RapidMiner Studioのライセンスは「GNU Affero General Public License v3.0」です。

詳細について、こちらを参照ください。
→GitHub →rapidminer/rapidminer-studio →LICENSE

動作環境

RapidMiner Studioは、「Windows」「Mac」「Linux」などの主要なOSで動作します。

ダウンロード

→GitHub →rapidminer/rapidminer-studio

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Talend Open Studio」「Kibana」「Pentaho」など。

「RapidMinerプラットフォーム」の製品構成

■RapidMinerプラットフォーム

RapidMinerは「機械学習」「ディープラーニング」「テキストマイニング」「予測分析」などのための統合環境を提供するデータサイエンスソフトウェアプラットフォームです。

「データ準備」「モデル検証」「モデル最適化」「結果の視覚化」などを含む機械学習プロセスのすべてのステップをサポートします。

RapidMinerは、クライアント/サーバーモデルを使用しており、「オンプレミス」または「パブリックまたはプライベートクラウドインフラストラクチャ」で動作します。

RapidMinerはデータ分析のための複数のプロダクトで構成されています。RapidMiner Studio(無償版)である「RapidMiner Studio Core」のみオープンソースとして利用でき、それ以外のプロダクトはプロプライエタリとして提供されています。

→RapidMiner →PRODUCTS

■ビジュアルデータサイエンスワークフローデザイナー「RapidMiner Studio」

RapidMiner Studioには、無償版と有償版が提供されています。

RapidMiner Studio(無償版)「RapidMiner Studio Core」

「RapidMiner Studio Core」は、無償で利用できるビジュアルデータサイエンスワークフローデザイナーです。

「RapidMiner Studio Core」プロジェクトは、有償版「RapidMiner Studio」のオープンソースコアを含み、有償版と同等の基本機能を有しています。

ただし、「1論理プロセッサのみ」および「処理対象データは10000行まで」という制限があります。

10000行を超えるデータを処理しようとした場合、「RapidMiner Studio Core」は自動的にデータをダウンサンプリングします。

→GitHub →rapidminer/rapidminer-studio

RapidMiner Studio(有償版)

「RapidMiner Studio(有償版)」はプロプライエタリです。

「SMALL」「MEDIUM」「LARGE」のサブスクリプションが用意されており、「処理可能なデータ件数」「性能」「追加機能」が異なります。

→RapidMiner →RapidMiner Studio

無償版と有償版の機能比較

「(無償版)RapidMiner Studio Core」と「(有償版)RapidMiner Studio」の機能性能比較は以下のページで確認できます。

→RapidMiner →RapidMiner Pricing →RapidMiner Studio

■予測モデル作成「RapidMiner Auto Model」

「RapidMiner Auto Model」は、自動機械学習とデータサイエンスのベストプラクティスを使用して数クリックで、簡単に説明できる予測モデルを作成できます。

→RapidMiner →RapidMiner Auto Model

主なポイント

・ガイド付きデータ準備機能
・自動モデル選択と調整機能
・自動フィーチャーエンジニアリング機能

■データ準備「RapidMiner Turbo Prep」

「RapidMiner Turbo Prep」は、データに対する「ブレンド」「ラングル」「クレンジング」などのデータ準備機能を提供します。

→RapidMiner →RapidMiner Turbo Prep

主なポイント

・直感的なデータ準備
・データの探索および視覚化
・データクレンジング機能—機械学習用データクレンジング処理を大幅簡素化
・データソースブレンド機能—複数データソースからのデータ結合
・ラングル機能—予測モデリングおよび分析用データ準備

■チームコラボレーション「RapidMiner Server」

「RapidMiner Server」は、「予測モデルの共有と再利用」「プロセス自動化」「本番へのモデルのデプロイ」などによりチームコラボレーションによるデータ分析作業を行える環境を提供します。

→RapidMiner →RapidMiner Server

主なポイント

・チームコラボレーション機能
・プロセス自動化機能
・高速モデル作成機能
・パフォーマンス監視機能
・デプロイ機能

■Hadoop統合「RapidMiner Radoop」

「RapidMiner Radoop」はHadoopと統合し、Hadoopの強力な処理能力を簡単に活用できる機能を提供します。

→RapidMiner →RapidMiner Radoop

主なポイント

・HadoopとSparkの複雑なデータサイエンスを排除
・Hadoop(Spark)用コードフリー機械学習機能
・Hadoopクラスタパワーを活用
・Hadoopのセキュリティ機能を活用

「RapidMiner Studio」の主な特徴

「RapidMiner Studio」の主な特徴

■データマイニング

データマイニングの基本処理は、「データ準備」→「データ分析」→「結果評価」という流れです。RapidMiner Studioは、この3つの処理にかかる作業コストを大幅に軽減できます。

分析処理フロー「プロセス」を作成し、プロセスに含まれる「オペレータ」ブロックをリンクさせていけば予測モデルを作成できます。

知見と行動を閉ループのように繰り返し実行し、予測分析を完成させていくと、予測に基づいた決定を運用できるようになります。

■ビジュアルワークフローデザイナ

RapidMiner Studioは、プログラミング不要でデータ分析処理を実施できます。

複雑なSQLを記述せずにデータ照会が可能で、ドラッグ&ドロップのビジュアルインターフェースを使用して予測モデルを作成でき、分類やパターン発見などの複雑な分析を行えます。

※「R言語」や「Python言語」を使用したプログラミングによる高度な分析も可能です。

■豊富なライブラリ

RapidMiner Studioでは、あらゆるユースケースに最適なモデルを構築するための1500以上の機械学習アルゴリズムと豊富なライブラリを利用できます。

「RapidMiner Studio」の主な機能

「RapidMiner Studio」の主な機能

■データソースアクセス機能

RapidMiner Studioは、構造化データや非構造化データなど、あらゆるタイプのデータソースにアクセスできます。

新しいデータソースに対しては、RapidMiner Marketplaceから拡張機能をダウンロードして接続できます。

主なデータソース

・ドキュメントファイル—TXT、Excel、CSV、PDF、HTML、XML
・バイナリファイル—各種メディアファイル
・データベース—MySQL、PostgreSQL、MongoDB、Cassandra
・データウェアハウス
・クラウドデータソース—Amazon S3、Google BigQuery、Dropbox
・ソーシャルメディア
・ビジネスアプリケーション など

■データ準備(ETLプロセス作成)機能

RapidMiner Studioの豊富なデータ準備機能は、あらゆる現実的なデータ変換の課題に対処できるため、予測分析に最適なデータセットを作成できます。

非構造化データと構造化データをブレンドして、予測分析のためにすべてのデータを活用できます。

■モデリング(機械学習モデル作成)機能

RapidMiner Studioでは、コードを書かずに堅牢な機械学習モデルを作成できます。

教師あり/教師なし学習のためのモデリング機能と機械学習アルゴリズムを備えており、どのようなユースケースに対しても可能な限り最善のモデル構築をサポートします。

■モデル検証機能

RapidMiner Studioは、モデルのパフォーマンスを正確かつ適切に推定するための手段を提供します。

他のツールがモデリングとモデル検証を密接に結びつける傾向がある場合、RapidMiner Studioは、前処理ステップで使用される情報がモデルトレーニングからモデルの適用に漏れるのを防ぐ厳格なモジュラーアプローチに従います。

■データ可視化機能

RapidMiner Studioは豊富な可視化機能を提供します。

「散布図」「散布図行列」「ヒストグラム」「箱ひげ図」「ヒートマップ」「自己組織化マップ」などが用意されており、3次元への可視化も可能です。

■プロセス自動化機能

RapidMiner Studioはプロセス自動化機能を提供します。

ビジュアルツールで「タスク」「分岐フロー」「システムリソースアクセス」などを配置してワークフローを作成できます。

■機能拡張「RapidMiner MarketPlace」

「RapidMiner MarketPlace」からさまざまなプラグイン機能をダウンロードして機能強化できます。独自拡張機能開発も可能です。
・テキスト処理機能
・Webマイニング機能
・Pythonスクリプト
・意味クラウドテキスト分析機能
・レコメンダー拡張機能
・ロゼットテキスト分析機能 など

→RapidMiner →MarketPlace

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

ウェビナーまとめ

2024.05.15

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

2024年3月12日に三菱電機ITソリューションズ株式会社とアットストリームパートナーズ合同会社の共催で、組立加工製造業向けのセミナー「なぜか高くなる原価を管理する 不確実性の時代を乗り切るためのコスト戦略とは」が開催されました。本セミナーでは、製造業における原価管理の現状と改善手法について深く掘り下げ、経営活動への具体的な活用方法を提示しました。今回は、その講演の要点をお伝えします。

【ChatGPT探訪】「 無限議論 」〜最強スタンド考察〜🤔

ChatGPT探訪

2024.05.07

【ChatGPT探訪】「 無限議論 」〜最強スタンド考察〜🤔

マジセミSNSに投稿した 【担当者A】の「 無限議論 」〜最強スタンド考察〜💬 を記事化したものです。 ChatGPTに課金していないみなさんにも、 AI同士の議論をお楽しみいただけます👍 ※原稿テキストを放り込むだけで、 ジョジョ風イラストを作成してしまう生成AIがすごくないですか?

【トレンド解説】米国における「 生成AI活用 」最新動向📈

トレンド解説

2024.05.07

【トレンド解説】米国における「 生成AI活用 」最新動向📈

「米国における 生成AI活用 最新動向」について解説しています。生成AIは日本企業にも多くの可能性をもたらし、「デスクワークの効率化」や「業務の自動化推進」に貢献しています。生成AIを理解し、活用することが、グローバルな競争力を高める鍵となります。