pandasで簡単データ表示,Anaconda,Python3

環境

macOS Sierra 10.12.6
ターミナル
Anaconda
Python 3.6.4

Anacondaをインストールすればデータサイエンスに必要なライブラリが使えるので、
ぜひインストールしましょう。

Anacondaのインストール手順についてはこちら
MacにAnacondaをインストールする

pandasで簡単にデータを表示してみよう

pandasは、データを変換したり解析したりするためのライブラリです。
Jupyter notebookを立ち上げて表示してみましょう。

くだけて言うなら、Pythonで書いたデータをいい感じに整えてくれるのがpandasです。

データの型が文字列でなければならないこともなく、データどうしが違う型でもかまいません。

ファイルやデータベースからデータを取り込む機能もあり、SQLやエクセル、CSVなどと組み合わせて利用できる点も嬉しいです。

import pandas as pd
from IPython.display import display


data = {'name': ["佐藤", "鈴木", "山田", "斎藤", "岩田"],
       'score': [85, 76, 78, 90, 50]
       }
data_pandas = pd.DataFrame(data)
display(data_pandas)

80より大きいスコアの人を出すときには、

display(data_pandas[data_pandas.score > 80])

辞書のキーを日本語にしても通ります。(日本語が混ざるドット記法があやうい感じはしますが)

import pandas as pd
from IPython.display import display


data = {'名前': ["佐藤", "鈴木", "山田", "斎藤", "岩田"],
       '得点': [85, 76, 78, 90, 50]
       }
data_pandas = pd.DataFrame(data)
display(data_pandas)

display(data_pandas[data_pandas.得点 > 80])