マジセミドライブ

ウェビナー関連のニュースやITサービス&ツールの最新情報を随時配信します。

OSS情報

2020.01.01

【OSS情報アーカイブ】Pandas

【OSS情報アーカイブ】Pandas

※当記事に記載されている情報は、古くなっている場合があります。オフィシャルサイトで最新情報をご確認ください。

「Pandas」とは

「Pandas」基本情報

概要

Pandas(パンダス)とは、Python用データ分析ライブラリです。高性能で使いやすいデータ構造とデータ解析ツールを提供します。データフレーム形式(2次元テーブル形式)を扱うことができ、特に時系列データ分析に向いています。

基本説明

Pandasは、主として、Excelのような2次元テーブルを対象とするライブラリです。R言語に類似するデータフレームを提供します。

データフレームで保存されたデータは操作しやすく、さまざまな分析を簡単に行えます。特に複雑な統計処理を数行で記述できるようになり、平均/標準偏差なども1つのコマンドで算出できます。

「Python with Pandas」は、数値処理/統計処理/機械学習などを行う際に「NumPy」などと共に利用され、「金融」「ニューロサイエンス」「経済」「統計/分析」などの幅広い学術および商用ドメインで利用されています。

主な特徴

データフレーム形式

データフレームとは行と列を持っており、「RDBのテーブル」「CSV」「Excel」のような形式です。

Pandasは、データフレーム形式でデータを扱い、列方向に各項目を保持して、行方向に実際に観測されたデータなどを記録していきます。

テーブルのような形式でデータを扱うため、データ操作もSQLとの対比として分かりやすいメリットがあります。

高速処理

Pandasは、Cython/C言語で実装されており、高速処理を行えます。

豊富な関数/ライブラリ/ツール

Pandasと連携できる豊富な関数/ライブラリ/ツールが用意されています。

主な機能

・DataFrameオブジェクト—統合インデックス作成による高速で効率的なデータ操作

・データアクセス—メモリ内のデータ構造と異なるフォーマット間でデータを読み書き(CSVファイル/テキストファイル/Microsoft Excel/SQLデータベース/HDF5形式など)

・データ統合処理—計算でラベルベースの自動整列を取得し、乱雑なデータを整然としたフォームに変換

・データセットの柔軟な再形成およびピボット

・インテリジェントラベルベース—スライシング、ファンシーインデックス、大規模データセットのサブセット

・列操作—サイズの変更可能性のためにデータ構造体から挿入および削除

・階層軸インデックス—低次元のデータ構造で高次元のデータを扱う直感的な方法を提供

・時系列関数—日付範囲の生成/変換、移動ウィンドウ統計、移動ウィンドウ線形回帰

同様製品

同様な機能を提供する製品として、次のようなものがあります。

オープンソース製品:「Numpy」「Scipy」など。

オフィシャルサイト

オフィシャルサイト

→Pandas(Python Data Analysis Library)

ライセンス情報

Pandasのライセンスは「BSD 3-Clause License」です。

詳細について、こちらを参照ください。
→Pandas →Package overview →License

ダウンロード

→Pandas →Get pandas!

参考元サイト

※定期的にメンテナンスを実施しておりますが、一部情報が古い場合がございます。ご了承ください。

この記事のタグ一覧

おすすめの記事

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

ウェビナーまとめ

2024.05.15

経営活動に活用できる 原価管理 を実現するには? 〜製造業の現実的な課題に向き合い、現場視点から改善する原価管理手法の必達プロセスをご紹介〜

2024年3月12日に三菱電機ITソリューションズ株式会社とアットストリームパートナーズ合同会社の共催で、組立加工製造業向けのセミナー「なぜか高くなる原価を管理する 不確実性の時代を乗り切るためのコスト戦略とは」が開催されました。本セミナーでは、製造業における原価管理の現状と改善手法について深く掘り下げ、経営活動への具体的な活用方法を提示しました。今回は、その講演の要点をお伝えします。

【OSS情報】LLMトレーニング用ライブラリ「 GPT-NeoX 」📚

OSS情報

2024.07.18

【OSS情報】LLMトレーニング用ライブラリ「 GPT-NeoX 」📚

「 GPT-NeoX 」は、GPU上で大規模言語モデル(LLM)を効率的にトレーニングするためのライブラリです。NVIDIAのモデルを基に独自の最適化が加えられ、オートレグレッシブ言語モデルのトレーニング手法を集約しています。

【OSS情報】WebベースAPI開発スイート「 Hoppscotch 」🌐

OSS情報

2024.07.04

【OSS情報】WebベースAPI開発スイート「 Hoppscotch 」🌐

「 Hoppscotch 」は、オープンソースのAPI開発エコシステムで、使いやすさとアクセシビリティを重視した軽量なWebベースのスイートです。無料版と有料版があり、PostmanやInsomniaの代替として利用可能です。