「sort_value」を使ってDataFrameを並び替えしたいんだけど、
同じ列に同じ値が入っている…。
A列が第一優先、B列が第二、C列が第三のように、
複数の列を並び替えできないの?
簡単にできますよ!
では今回は、pandasのDataFrameで
「複数の列をソートする方法」
をできるだけわかりやすく解説いたします。
【著者情報】
Python歴3年。
入社2年目の春に先輩が突然トンズラし、業務を半分肩代わりするハメに…。
今までの1.5倍の仕事をこなせるはずもなく、苦しむ毎日。
業務効率化を模索中にPythonと出合う。
業務とPythonの相性が良く、2倍以上の効率化を実現。現在も効率化を進行中。
pandasのDataFrameで複数の列をソートするには
「sort_value()」の引数に複数の列を指定することで実現できます。
まずは実行見本をどうぞ。
実行見本
全コード
ひとまず全コードを網羅します。解説は後ほど行います。
import pandas as pd
df = pd.read_excel('input.xlsx')
df = df.sort_values(by=['大分類', '中分類', '小分類'])
df.to_excel('output.xlsx', index = None)
df = df.sort_values(by=['大分類', '中分類', '小分類'])
事前準備
- pandasのインストール
「DataFrame」を作成・編集するには、「pandas」が必要になります。
pandasのインストール方法
pandasを初めて使用する場合は、下記コードを入力・実行して、インストールしてください。
pip install pandas
※pandasを使用したことがある場合は、このインストール作業は不要です。
インストールができない場合の対処法などは下記記事をご参考ください。
DataFrameの基礎解説
「read_excel」などは下記記事で解説しております。ご参考ください。
解説
※わかりやすさを重視しております。厳密には解釈が異なる場合がありますことをご了承ください。
df = df.sort_values(by=['大分類', '中分類', '小分類'])
上記コードにて、複数の列をソートできます。
「sort_value()」の詳細は下記記事をご参考ください。
下記テンプレを見ていただいた方がわかりやすいかと思います。
<テンプレ>
【 データフレーム = データフレーム.sort_values(by=[‘第一優先‘, ‘第二優先‘, ‘第三優先‘・・・]) 】
まず、第一優先の列(見本では大分類)が並び替えられ、次に第二優先、第三優先といった具合です。
数字ではなく、ひらがなでも可能です。
うまく動作しない時
エラーが出る
No such file or directory: ○○
これは、読み込むファイルやフォルダが見つからないというエラーです。
読み込むファイルのファイル名と構文のファイル名が一致しているか確認しましょう。
詳しい解説は、下記記事をご参考ください。
○○ is not defined
今まで出てきていない変数などを処理しようとした時に出るエラーです。
変数名などが間違っていないかチェックしましょう。
詳しい解説は、下記記事をご参考ください。
その他のエラー
その他のエラーが出た場合は、エラー文をコピーしてNETで検索してみましょう。
最後に
pandasのDataFrameで複数の列をソートする方法を解説いたしました。
今回のような局面は時々ありますので、ぜひご活用ください。
当ブログでは、Pythonに関する情報を配信しております。
この記事がわかりやすいと感じた方は、他の記事も読んでいってください。
挫折せずにPythonを独学で学習する方法は特におすすめです。
最後までお読みいただき、ありがとうございました。がんばってください!