【Pandas】空港のクレームデータを分析してみた(その2)

さて、前回に引き続き、空港のクレームデータを分析してみます。

【Pandas】空港のクレームデータを分析してみた

アメリカだと空港に預けた荷物のチェックインや機内への運搬、TSAによる中身チェックの過程で、荷物が破損しそれに対するクレームが多いみたいです。

日本では考えられません。

その多数のクレームをまとめたデータが、以下のTSAクレームデータです。

事件の発生日、空港の名前、航空会社、クレームの種類、クレームの発生した場所、示談金(Close Amount)などが書かれています。

Dispositonというのは、処分という意味で、Deny(却下)なのかApprove in Full(全額支払い)などがあるようです。

示談金を分析してみます。データに文字列(ハイフン)が入っていると計算できないので、ハイフンは全て0に変換します。

df["Close Amount"] = df["Close Amount"].apply(dash_to_zero)
df[df["Close Amount"] > 0].describe()
	Close Amount
count	2360.000000
mean	228.279453
std	743.720179
min	1.250000
25%	44.470000
50%	100.000000
75%	240.942500
max	25483.440000

describeを使うと、最大値、最小値、平均値、分散、パーセンタイルが全て計算できます。

 

1ドル100円と仮定します。

最高で、2.5万ドル(250万円)、最低で1.25ドル(125円)程度の示談金であることが分かりました。

250万ってすごいですね。空港に訴えてそんだけもらえるって、高級な壺でも入っていたのでしょうか。

中央値は100ドル(1万円)です。

 

示談金をグラフ化してみましょう。

import matplotlib as plt
df.plot(x='Incident Date', y='Close Amount')
plt.show()

 

一目瞭然ですね。200万越えの示談金の存在感がすごいw

pandas便利や。

 

おわり。

ABOUTこの記事をかいた人

個人アプリ開発者。Python、Swift、Unityのことを発信します。月間2.5万PVブログ運営。 Twitter:@yamagablog