このサイトはアドセンスやアフィリエイト広告を利用しています

python

【解決】pandasで最頻値.mode()[0]ってなんでつけなきゃいけないの?

pythonのpandasで合計や平均などはリストを指定しなくてもいいのに、なぜ最頻値の場合は[0]をつけなければいけないのか簡単に説明します

最頻値は重複することがあるから何番目か指定が必要

実際に例をみてみましょう

例えば好きな色があるとします

カラム名:color


オレンジ



オレンジ

オレンジ

このとき
赤3つ
青2つ
オレンジ3つ
緑1つ

赤とオレンジが3つずつありますよね

そうなると最頻値は赤とオレンジとなります

これをリスト配列で返してくるので、その場合どっちを使うか選択する必要があるのです

っということで最頻値 
df[”color”].mode[0] or df[”color”].mode[1] といったように指定して上げる必要があります

-python