マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】Apache Cassandra

【OSS情報アーカイブ】Apache Cassandra

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「Apache Cassandra」とは

基本情報

概要

Apache Cassandra(アパッチ カサンドラ)とは、オープンソースの分散データベース管理システムです。構造化キーバリュー型データストアを提供します。「単一障害点を持たない」「スケーラブル」「高速性」などの特徴があります。

基本説明

Apache Cassandraは、さまざまなアプリケーションに対応できる「分散型」「汎用」「非リレーショナル」データベースです。

経緯

Cassandraは、もともとFacebook社において大規模データ格納のために開発されました。
・2008年、オープンソース公開
・2009年、Apache Incubatorプロジェクトに登録
・2010年、Apacheトッププロジェクトに昇格

主な特徴

データモデル

Cassandraのデータモデルは、「Google Bigtable」や「Amazon Dynamo」などの分散システムデザインを融合させて設計されました。

「キーバリュー型データ構造」のみではなく、「カラム型データ構造」も持っています。単純なキーバリュー型では適用が難しい複雑なデータにも対応できます。

「高度な非正規化モデル」により、データを効率良く格納して検索できる設計になっています。数千から数万の列を持つ巨大なテーブルで非常に高いパフォーマンスを実現します。

分散型耐障害性

Apache Cassandraでは、クラスタ上の全ノードが対等の扱いとなっているため、管理用マスターノードが必要ありません。そのため、ネットワークボトルネックや単一障害点が存在しない構造になっています。

部分的な故障で全体が停止することはなく、高い耐障害性を実現できます。故障したノードは、ダウンタイムなしにリプレースして復旧できます。

スケーラブル

Apache Cassandraは、ノード(マシン)を追加すれば、読み取りと書き込みのスループットが直線的に増加する設計になっています。ノード追加時にダウンタイムは発生しません。

数千のノードで構成されるペタバイト級のCassandraクラスタを構築することもできます。

高速性能

Cassandraは、非常に高速な読み込み/書き込みが可能です。

データの大半をノードのメモリ上に保持することで高速性を実現しています。

レプリケーション

データは、クラスタをまたいだ複数ノードに自動的にレプリケートされます。更新ごとに「同期レプリケーション」または「非同期レプリケーション」を選択できます。

既存ノード削除時や、新ノード追加時には、クラスタをまたがるデータのバランスを自動的に維持します。

Apache Cassandraは「複数データセンターとクラウド環境間でのレプリケーションをサポート」していることで、高い人気を得ています。

セキュリティ

「クライアントからの伝送路上のデータ暗号化」や「ノード間通信の暗号化」を提供します。

同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「HBase」「Apache CouchDB」「MongoDB」「Redis」「Neo4j」など。

導入事例

Apache Cassandraは、「Facebook」「Twitter」「Apple」「Cisco」などの多くの企業への導入実績があります。

特に、Appleでは、75000台以上のCassandraクラスタで10PB以上のデータを格納しています。

ライセンス情報

Apache Cassandraのライセンスは「Apache License 2.0」です。このライセンスに従うことを条件として、ソースコードの改変と公開が許可されています。

ダウンロード

ダウンロードページ

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 2029年問題 」とは?📅

「 2029年問題 」とは、高校でのデジタル教育改革により、新入社員と既存社員間でデジタルスキル格差が拡大する懸念を指します。企業は早急に対応が求められています。この格差は、企業競争力や業務効率にも、影響を及ぼす可能性があります。

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 経済産業省:コンテンツ制作のための 生成AI 利活用ガイドブック 」とは?📘

経済産業省による「 生成AI 利活用ガイドブック 」は、企業やクリエイター向けに、安心して「生成AI」を利用するための、「指針」「実例」「注意点」を明示しています。「業務効率化」や「新しいアイデア創出」の支援を目的としています。

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

デジタル寺田の3分用語解説

2024.11.18

【デジタル寺田の3分用語解説】「 VMWare 問題 」とは?🖥️

「 VMWare 」の仮想化技術は、「ITインフラの効率化」に大きく貢献する技術ですが、Broadcomによる買収後のライセンス変更が大きな問題として注目されています。柔軟で慎重な契約見直しが今後の鍵となります。