環境
macOS Sierra 10.12.6
ターミナル
Anaconda
Python 3.6.4
Anacondaをインストールすればデータサイエンスに必要なライブラリが使えるので、
ぜひインストールしましょう。
Anacondaのインストール手順についてはこちら
→MacにAnacondaをインストールする
pandasで簡単にデータを表示してみよう
pandasは、データを変換したり解析したりするためのライブラリです。
Jupyter notebookを立ち上げて表示してみましょう。
くだけて言うなら、Pythonで書いたデータをいい感じに整えてくれるのがpandasです。
データの型が文字列でなければならないこともなく、データどうしが違う型でもかまいません。
ファイルやデータベースからデータを取り込む機能もあり、SQLやエクセル、CSVなどと組み合わせて利用できる点も嬉しいです。
import pandas as pd from IPython.display import display data = {'name': ["佐藤", "鈴木", "山田", "斎藤", "岩田"], 'score': [85, 76, 78, 90, 50] } data_pandas = pd.DataFrame(data) display(data_pandas)
80より大きいスコアの人を出すときには、
display(data_pandas[data_pandas.score > 80])
辞書のキーを日本語にしても通ります。(日本語が混ざるドット記法があやうい感じはしますが)
import pandas as pd from IPython.display import display data = {'名前': ["佐藤", "鈴木", "山田", "斎藤", "岩田"], '得点': [85, 76, 78, 90, 50] } data_pandas = pd.DataFrame(data) display(data_pandas)
display(data_pandas[data_pandas.得点 > 80])