【Pythonデータサイエンス入門,matplotlib】統計を利用して日本の人口について見てみよう②

環境

macOS Sierra 10.12.6
ターミナル
Anaconda
Python 3.6.4

Anacondaをインストールすればデータサイエンスに必要なライブラリが使えるので、
ぜひインストールしましょう。

Anacondaのインストール手順についてはこちら
MacにAnacondaをインストールする

matplotlibとは

データ可視化ツールのうちのひとつです。
データ分析を行う際に使います。

たった数行のPythonコードで簡単な棒グラフ、折れ線グラフ、散布図などを表示することができます。
matplotlib→https://matplotlib.org/
参考:matplotlibで日本語対応(文字化け解決),Mac

当記事で使うデータ

総務省統計局の人口推計のデータを参照します。
転載について記載するよう書いてあったので記載しておきます。

「人口推計」(総務省統計局)(http://www.stat.go.jp/data/jinsui/pdf/201802.pdf)(2018年3月8日に利用)

class(クラス)の概念を利用してみよう

前回:【Pythonデータサイエンス入門,matplotlib】統計を利用して日本の人口について見てみよう①

前回は男性と女性の人口をグラフ化してみました。

いちおう前回のコードも載せておきます。

さて、上記の2つのモジュール(ファイル)で異なっている点は、
・populationリストの中身
・plt.titleの中身("男性の日本人人口"か"女性の日本人人口"かの違い)

だけでした。

つまり共通部分のほうが多く、
populationの中身とtitleの中身さえその時々に応じて必要なものを用意してやれば良さそうだなと気づきます。
加えて、年齢も現在は0-4歳など5歳分ずつで刻んでいますが、10歳刻み(0-9歳など)が欲しくなることもあるかもしれません。
なので、titleとageとpopulationに関して、抽象的に扱えるような設計にしてみましょう

ja_population.pyというモジュールを作ります。

このja_poputlation.pyを対話インタープリタから利用してみましょう。

様子としてはこんな感じです。

~/Documents/python_codeにja_population.pyを置いています。
ここでpythonの対話型インタープリタを立ち上げます。

from ja_population import JapanPopulationでja_population.pyのJapanPopulationクラスを使うと宣言します。pyという部分は書かないことに注意しましょう。

from モジュール名 import クラス名

あとはJapanPopulationクラスのインスタンスmjpを作り、show_graph()関数を実行します。

このように書くと、今後ageやpopulationやタイトルなどが変わっても柔軟に対応できます。
X軸やY軸のタイトルも抽象化できますので、適宜やってみるといいかもしれません。

では、また次回もよろしくお願いします。