各月の売り上げを順々に足していって、累積を表示したい。
なるほど。
案外簡単にできます!
では今回は、pandasのDataFrameで
「一つ前の行の値を足す方法」を
できるだけわかりやすく解説いたします。
【著者情報】
Python歴3年。
入社2年目の春に先輩が突然トンズラし、業務を半分肩代わりするハメに…。
今までの1.5倍の仕事をこなせるはずもなく、苦しむ毎日。
業務効率化を模索中にPythonと出合う。
業務とPythonの相性が良く、2倍以上の効率化を実現。現在も効率化を進行中。
pandasで一つ前の行の値を足すには
「cumsum」を使います。まずは実行見本をどうぞ。
実行見本
全コード
ひとまず全コードを網羅します。解説は後ほど行います。
import pandas as pd
df = pd.read_excel('input.xlsx')
df['累積'] = df['売上'].cumsum()
df.to_csv('output.csv', encoding='shift-jis', index = None)
df['累積'] = df['売上'].cumsum()
事前準備
- pandasのインストール
「DataFrame」を作成・編集するには、「pandas」が必要になります。
pandasのインストール方法
pandasを初めて使用する場合は、下記コードを入力・実行して、インストールしてください。
pip install pandas
※pandasを使用したことがある場合は、このインストール作業は不要です。
インストールができない場合の対処法などは下記記事をご参考ください。
DataFrameの基礎解説
「read_excel」などは下記記事で解説しております。ご参考ください。
解説
※わかりやすさを重視しております。厳密には解釈が異なる場合がありますことをご了承ください。
df['累積'] = df['売上'].cumsum()
上記一文にて、累積を表示することができます。
右辺に累積を計算する元となる列を指定し、「.cumsum()」を記述します。
左辺には、計算した累積を表示する列を指定します。
左辺の列が存在しない場合は新規追加されます。
列追加については下記記事をご参考ください。
<テンプレ>
【 データフレーム[‘累積を表示したい列名‘] = データフレーム[‘累積の計算元の列名‘].cumsum() 】
「累積」列が新規追加され、累積が表示できました。
うまく動作しない時
エラーが出る
No such file or directory: ○○
これは、読み込むファイルやフォルダが見つからないというエラーです。
読み込むファイルのファイル名と構文のファイル名が一致しているか確認しましょう。
詳しい解説は、下記記事をご参考ください。
○○ is not defined
今まで出てきていない変数などを処理しようとした時に出るエラーです。
変数名などが間違っていないかチェックしましょう。
詳しい解説は、下記記事をご参考ください。
その他のエラー
その他のエラーが出た場合は、エラー文をコピーしてNETで検索してみましょう。
最後に
pandasのDataFrameで一つ前の行の値を足す(累計)方法を解説いたしました。
当ブログでは、pandasやopenpyxlなど、Pythonに関する情報を配信しております。
この記事がわかりやすいと感じた方は、他の記事も読んでいってください。
挫折せずにPythonを独学で学習する方法は特におすすめです。
最後までお読みいただき、ありがとうございました。がんばってください!