DataFrameに取り込んだデータから円グラフを作りたい…。
簡単にできますよ!
では今回は、「pandasのDataFrameから円グラフを作成する方法」
をできるだけわかりやすく解説いたします。
「凡例」や「割合」を表示する方法も紹介いたしますので、
ぜひ最後まで読んでいってください。
【著者情報】
Python歴3年。
入社2年目の春に先輩が突然トンズラし、業務を半分肩代わりするハメに…。
今までの1.5倍の仕事をこなせるはずもなく、苦しむ毎日。
業務効率化を模索中にPythonと出合う。
業務とPythonの相性が良く、2倍以上の効率化を実現。現在も効率化を進行中。
[pandas]DataFrameから円グラフを作成するには
「plot.pie」を使います。まずは実行見本をどうぞ。
実行見本
全コード
ひとまず全コードを網羅します。解説は後ほど行います。
import pandas as pd
import japanize_matplotlib
df = pd.read_excel('input.xlsx')
df.set_index('年代', inplace = True)
df['入場者数'].plot.pie(figsize=(4, 4))
df['入場者数'].plot.pie(figsize=(4, 4))
事前準備
- pandasのインストール
- japanize_matplotlibのインストール
「DataFrame」を作成・編集するには、「pandas」が必要になります。
「japanize_matplotlib」は日本語表示が可能になるため、必要に応じてインストールしてください。
pandasのインストール方法
pandasを初めて使用する場合は、下記コードを入力・実行して、インストールしてください。
pip install pandas
※pandasを使用したことがある場合は、このインストール作業は不要です。
インストールができない場合の対処法などは下記記事をご参考ください。
japanize_matplotlibのインストール方法
インストール方法は「pandas」と同様です。
下記コードを入力・実行してください。
pip install japanize_matplotlib
※japanize_matplotlibを使用したことがある場合は、このインストール作業は不要です。
DataFrameの基礎解説
「read_excel」などは下記記事で解説しております。ご参考ください。
解説
※わかりやすさを重視しております。厳密には解釈が異なる場合がありますことをご了承ください。
import pandas as pd
import japanize_matplotlib
「pandas」と「japanize_matplotlib」をインポートします。
データ内に日本語が含まれる場合、「japanize_matplotlib」をインポートしないと文字化けします。
▼「japanize_matplotlib」をインストール・インポートしなかった場合
df = pd.read_excel('input.xlsx')
df.set_index('年代', inplace = True)
インデックスが円グラフのラベル部分に表示されるため、5行目でインデックスを変更しています。
(年代をラベルに表示したいので、年代をインデックスに変更)
これを書かないと行番号(0、1、2、3など)がラベルに表示されてしまいます。
▼インデックス変更をしなかった場合
「inplace = True」はDataFrameに保存するかどうかの設定です。
保存しない場合は「inplace = False」と記述するか、記述自体しなくても大丈夫です。
df['入場者数'].plot.pie(figsize=(4, 4))
上記一文にて、df(データフレーム)の「入場者数」を円グラフにすることができます。
print等を使わなくても、コードエディタに表示されます。
▼「JupyterLab」に表示された場合の一例
「figsize」はグラフのサイズ(幅, 高さ)です。
特に指定がなければ記述しなくても大丈夫です。
後ほど、違うサイズもお見せします。
<テンプレ>
【 データフレーム[‘円グラフにする列名’].plot.pie(figsize=(グラフの幅, グラフの高さ)) 】
円グラフを出力したい場合は、openpyxlで作成するのがオススメです。
凡例を表示する方法
グラフ内に「凡例」を表示してみましょう。
▼凡例
ひとまず全コードをお見せします。
これで凡例付きのグラフを作成することができます。
import pandas as pd
import japanize_matplotlib
df = pd.read_excel('input.xlsx')
df.set_index('年代', inplace = True)
df.plot.pie(y='入場者数',figsize=(8, 8))
変わっているのは7行目だけです。
▼前項
df['入場者数'].plot.pie(figsize=(4, 4))
▼今回
df.plot.pie(y='入場者数',figsize=(8, 8))
前項ではdfの「入場者数」のみで円グラフを作りましたが、
今回はdf全てにして「y=’入場者数’」の指定をしています。
グラフの大きさを変えているのは、凡例とグラフが重なってしまうからです。
必要に応じて調整してください。
▼「figsize=(4, 4)」で作成した場合
割合を表示する方法
次に、割合を表示する方法を紹介いたします。
わかりやすくなるのでオススメです。
import pandas as pd
import japanize_matplotlib
df = pd.read_excel('input.xlsx')
df.set_index('年代', inplace = True)
df.plot.pie(y='入場者数',figsize=(8, 8), autopct='%1.1f%%')
今回も変わっているのは7行目の一部だけです。
df.plot.pie(y='入場者数',figsize=(8, 8), autopct='%1.1f%%')
「autopct=’%1.1f%%’」を追加することにより、グラフ内に割合を表示することができます。
うまく動作しない時
エラーが出る
No such file or directory: ○○
これは、読み込むファイルやフォルダが見つからないというエラーです。
読み込むファイルのファイル名と構文のファイル名が一致しているか確認しましょう。
詳しい解説は、下記記事をご参考ください。
○○ is not defined
今まで出てきていない変数などを処理しようとした時に出るエラーです。
変数名などが間違っていないかチェックしましょう。
詳しい解説は、下記記事をご参考ください。
その他のエラー
その他のエラーが出た場合は、エラー文をコピーしてNETで検索してみましょう。
まとめ
pandasのDataFrameで円グラフを作成する方法を解説いたしました。
当ブログでは、pandasやopenpyxlなど、Pythonに関する情報を配信しております。
この記事がわかりやすいと感じた方は、他の記事も読んでいってください。
挫折せずにPythonを独学で学習する方法は特におすすめです。
最後までお読みいただき、ありがとうございました。がんばってください!