さて、前回に引き続き、空港のクレームデータを分析してみます。
アメリカだと空港に預けた荷物のチェックインや機内への運搬、TSAによる中身チェックの過程で、荷物が破損しそれに対するクレームが多いみたいです。
日本では考えられません。
その多数のクレームをまとめたデータが、以下のTSAクレームデータです。

事件の発生日、空港の名前、航空会社、クレームの種類、クレームの発生した場所、示談金(Close Amount)などが書かれています。
Dispositonというのは、処分という意味で、Deny(却下)なのかApprove in Full(全額支払い)などがあるようです。
示談金を分析してみます。データに文字列(ハイフン)が入っていると計算できないので、ハイフンは全て0に変換します。
df["Close Amount"] = df["Close Amount"].apply(dash_to_zero) df[df["Close Amount"] > 0].describe()
Close Amount count 2360.000000 mean 228.279453 std 743.720179 min 1.250000 25% 44.470000 50% 100.000000 75% 240.942500 max 25483.440000
describeを使うと、最大値、最小値、平均値、分散、パーセンタイルが全て計算できます。
1ドル100円と仮定します。
最高で、2.5万ドル(250万円)、最低で1.25ドル(125円)程度の示談金であることが分かりました。
250万ってすごいですね。空港に訴えてそんだけもらえるって、高級な壺でも入っていたのでしょうか。
中央値は100ドル(1万円)です。
示談金をグラフ化してみましょう。
import matplotlib as plt df.plot(x='Incident Date', y='Close Amount') plt.show()

一目瞭然ですね。200万越えの示談金の存在感がすごいw
pandas便利や。
おわり。