Pandas(パンダス)とは
calendar_month2020-04-01 公開 update2020-05-19 更新
データ解析作業を行うためのオープンソースの Python ライブラリ。
データの確認、視覚化、整形、欠損値のハンドリング、各種集計など、大量のデータを解析する上で必須となる作業が、シンプルなコードで、比較的高速に実現できる。
アメリカの投資会社に所属していた Wes McKinney が財務データを分析するために作成。現在は、コミュニティによって開発が進められている。
ビッグデータと呼ばれるような膨大なデータを解析したり、機械学習で十分な精度を得るための大量の教師データを準備するときは、後工程で問題なく処理を行えるようあらかじめデータを整えたり概要を把握しておく必要がある。
Pandas はこのような作業で使用されることが多い。
Pandas では、基本的に数表データをデータフレームというデータ構造で管理する。上記に述べたようなデータ操作は、このデータ型に対する演算の形で表現される。
label 関連特集
特集1:AI人材をとりまく市場環境と実態
特集2:AI人材モデルの解説
特集3:AI人材の育て方
label 関連するタグ
教育研修担当 (トレーニング担当者) のためのWebマガジンを編集しています。
-
- 「こんな特集、記事を読んでみたい」というリクエスト
- 「こんな記事を書いてみたい」という執筆者の方のお問い合わせ
や誤植のご連絡など、お問い合わせフォームより受付しています。
お気軽に問い合わせくださいませ!!
contacts トレタン お問い合わせフォーム