【Pandas】データの抽出、ソート、関数の適用

 

Pandasのデータフレームで、データを抽出したり、ソートしたり、関数を使う方法をご紹介します。

スポンサーリンク

使用するデータ

 

適当に自分で作った以下のCSVデータを使います。

 

 

本や映画の名前、ジャンル、評判などからなる6行のデータです。

これを読んで表示します。

 

一行目がデータではなくラベルとして認識されました。番号も自動的に割り振られます。

 

データを抽出する

 

locを使ったデータの抽出

 

ジャンル(genre)がプログラミングのものだけ取り出してみます。locを使います。

 

 

 

whereを使ったデータの抽出

 

locを使うと条件に合わないデータは表示されませんでした。whereを使うと条件に合わないデータはNaN(欠損値)として、表示されます。

 

データをソートする

 

id順に並べてみます。

 

降順で並べる場合は、ascending = Falseを引数に追加します。

 

データフレームに関数を適用する

 

pandasでは、applymapを使うことでデータフレームに関数を適用することができます。

例えば、上記データのタイトルやジャンルの文字列の長さを取得したい場合、ラベルを指定してlen関数を適用することで文字列の長さを計算できます。

 

おわり。