マジセミドライブ
ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。
OSS情報
2020.01.01
【OSS情報アーカイブ】Pandas


※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。
「Pandas」とは
「Pandas」基本情報
概要
Pandas(パンダス)とは、Python用データ分析ライブラリです。高性能で使いやすいデータ構造とデータ解析ツールを提供します。データフレーム形式(2次元テーブル形式)を扱うことができ、特に時系列データ分析に向いています。
基本説明
Pandasは、主として、Excelのような2次元テーブルを対象とするライブラリです。R言語に類似するデータフレームを提供します。
データフレームで保存されたデータは操作しやすく、さまざまな分析を簡単に行えます。特に複雑な統計処理を数行で記述できるようになり、平均/標準偏差なども1つのコマンドで算出できます。
「Python with Pandas」は、数値処理/統計処理/機械学習などを行う際に「NumPy」などと共に利用され、「金融」「ニューロサイエンス」「経済」「統計/分析」などの幅広い学術および商用ドメインで利用されています。
主な特徴
データフレーム形式
データフレームとは行と列を持っており、「RDBのテーブル」「CSV」「Excel」のような形式です。
Pandasは、データフレーム形式でデータを扱い、列方向に各項目を保持して、行方向に実際に観測されたデータなどを記録していきます。
テーブルのような形式でデータを扱うため、データ操作もSQLとの対比として分かりやすいメリットがあります。
高速処理
Pandasは、Cython/C言語で実装されており、高速処理を行えます。
豊富な関数/ライブラリ/ツール
Pandasと連携できる豊富な関数/ライブラリ/ツールが用意されています。
主な機能
・DataFrameオブジェクト—統合インデックス作成による高速で効率的なデータ操作
・データアクセス—メモリ内のデータ構造と異なるフォーマット間でデータを読み書き(CSVファイル/テキストファイル/Microsoft Excel/SQLデータベース/HDF5形式など)
・データ統合処理—計算でラベルベースの自動整列を取得し、乱雑なデータを整然としたフォームに変換
・データセットの柔軟な再形成およびピボット
・インテリジェントラベルベース—スライシング、ファンシーインデックス、大規模データセットのサブセット
・列操作—サイズの変更可能性のためにデータ構造体から挿入および削除
・階層軸インデックス—低次元のデータ構造で高次元のデータを扱う直感的な方法を提供
・時系列関数—日付範囲の生成/変換、移動ウィンドウ統計、移動ウィンドウ線形回帰
同様製品
同様な機能を提供する製品として、次のようなものがあります。
オープンソース製品:「Numpy」「Scipy」など。
オフィシャルサイト
オフィシャルサイト
→Pandas(Python Data Analysis Library)
ライセンス情報
Pandasのライセンスは「BSD 3-Clause License」です。
詳細について、こちらを参照ください。
→Pandas →Package overview →License
ダウンロード
参考元サイト
※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。
この記事のタグ一覧
フリーワード検索
カテゴリー一覧
アクセスランキング
- 🏆ランク1位🏆
【OSS情報アーカイブ】SonarQube - 🏆ランク2位🏆
【OSS情報アーカイブ】NetBSD - 🏆ランク3位🏆
【OSS情報アーカイブ】nano - 🏆ランク4位🏆
【無料で使える】「 プロジェクト管理 」ツールまとめ - 🏆ランク5位🏆
【OSS情報アーカイブ】K-9 Mail - 🏆ランク6位🏆
【OSS情報アーカイブ】fping - 🏆ランク7位🏆
【OSS情報アーカイブ】Snort - 🏆ランク8位🏆
【OSS情報アーカイブ】Concourse CI - 🏆ランク9位🏆
【OSS情報アーカイブ】JBoss Enterprise Application Platform - 🏆ランク10位🏆
【OSS情報アーカイブ】Cyrus IMAP