映画のカテゴリーなどを1,0で表すことをワンホットエンコーディングと言います。
カテゴリーがAnimationであれば1、そうでなければ0のように表示します。

pandasのget_dummies
を使うと、
1 |
pd.get_dummies(df_movie['Genre']) |
|
で区切られているジャンルを分割するには以下のようにする。
1 |
df_movie['Genre'].str.get_dummies(sep='|') |
元のデータフレームに結合する時には、concat
を使う。
1 |
df_movie = pd.concat([df_movie, df_movie['Genre'].str.get_dummies(sep='|')], axis=1) |
元のカラムが必要ない場合は、
1 |
df_movie.drop('Genre', axis=1) |
で削除できます。