マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】Presto

【OSS情報アーカイブ】Presto

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「Presto」とは

「Presto」基本情報

■概要

Presto(プレスト)とは、分析クエリ実行用分散型SQLクエリエンジンです。

■基本説明

Prestoは、ペタバイトクラスまでのあらゆるサイズのデータ​​ソースに対してインタラクティブな分析クエリを実行するためのオープンソースの分散型SQLクエリエンジンです。

そのアーキテクチャにより、ユーザーは「Hadoop」「AWS S3」「Alluxio」「MySQL」「Cassandra」「Kafka」「MongoDB」などのさまざまなデータソースにクエリを実行できます。

■経緯

・2013年 初版リリース

■導入事例

「Facebook」では、Prestoを使用して、300PBのデータウェアハウスを含む複数の内部データストアに対するインタラクティブなクエリを実行しています。1日あたり、1000人を超えるFacebookスタッフが、合計1ペタバイトを超える合計30000件を超えるクエリを実行しています。

また、「Airbnb」や「Dropbox」を含む大手インターネット企業でもPrestoが採用されています。

■オフィシャルサイト情報

オフィシャルサイト

→Presto(Distributed SQL Query Engine for Big Data)

ライセンス情報

Prestoのライセンスは「Apache License 2.0」です。

詳細について、こちらを参照ください。
→GitHub →prestodb/presto →LICENSE

ダウンロード

Prestoは「Linux」または「Mac OS X」で動作します。

→GitHub →prestodb/presto

■同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Apache Drill」など。

「Presto」の主な特徴

■分析用データベース

Prestoは、データウェアハウスまたは分析用に設計および最適化されているデータベースです。1秒~数分の応答時間を期待するアナリストを対象としています。

そのため、「MySQL」「PostgreSQL」「Oracle」などの汎用リレーショナルデータベースに代わるものではなく、オンライントランザクション処理を実行するようには設計されていません。

■分散システム

Prestoはクラスタ上で動作する分散システムです。

フルインストールには「コーディネーター」+「複数のワーカー」が含まれます。クエリはPresto CLIなどのクライアントからコーディネータに送信されます。コーディネーターが「照会」「解析」「分析」などを計画し、ワーカーに分配します。

■組織全体の分析

Prestoは、分散照会を使用して膨大な量のデータを効率的に照会するように設計されたツールです。「Hive」「Cassandra」「各種リレーショナルデータベース」「独自データストア」など、さまざまな場所に存在するデータを照会できます。

1つのPrestoクエリで複数ソースからのデータを組み合わせることができ、組織全体の分析が可能になります。

■Prestoリソース

多くのPresto用リソースが用意されています。
・Presto管理ツール
・Prestoクライアント
・PrestoODBC
・Prestoライブラリ
・Prestoホスティング
・Prestoコネクタ
・Prestoエンタープライズサポート
・PrestoCloud(AWS/Azure)

→Presto →Resources

 

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【デジタル寺田の3分用語解説】「 人的資本経営 」とは?🧑‍💼

デジタル寺田の3分用語解説

2024.10.08

【デジタル寺田の3分用語解説】「 人的資本経営 」とは?🧑‍💼

「 人的資本経営 」は、企業が従業員のスキルや経験、意欲を高めるために投資を行い、長期的な企業価値の向上を目指す経営手法です。本記事では、人的資本経営の意義やその具体的な取り組みについて分かりやすく解説します。

【デジタル寺田の3分用語解説】「 ASM 」とは?🧩

デジタル寺田の3分用語解説

2024.10.07

【デジタル寺田の3分用語解説】「 ASM 」とは?🧩

「 ASM 」(アタックサーフェースマネジメント)は、システムに存在する脆弱性や攻撃の入り口を可視化し、管理することでリスクを特定し、対策を講じる手法です。攻撃者がシステムに侵入するために利用できる潜在的な脆弱性を理解し、適切な対策を取ることが、セキュリティ対策の第一歩となります。

【デジタル寺田の3分用語解説】「 SAP 2027問題 」とは?⏳

デジタル寺田の3分用語解説

2024.10.07

【デジタル寺田の3分用語解説】「 SAP 2027問題 」とは?⏳

「 SAP 2027問題 」とは、「SAP ERP 6.0」が2027年末でサポート終了する問題です。セキュリティリスクを避けるため、早期に新システムへの移行が必要です。移行は業務プロセスの見直し、効率化のチャンスにもなります。新しい技術を積極的に導入し、挑戦していくことが成功の鍵となります。