ゼファーネットのロゴ

データの視覚化による米国の交通事故からのデータの分析

日付:

未定義のハッカー正午のプロフィール写真

24秒ごとに、道路上で人命が失われ、国内総生産の約3%の費用が国にかかります– 世界保健機関.

の致死率で 視聴者の38%が 人口 100,000 人あたりの交通事故は、米国の主な死亡原因です。 2019年には、次のことが報告されました 36,096 米国の道路で命が失われました 国道交通システム管理 (NHTSA)、それは米国経済に年間約871億ドルの費用がかかります。  

この記事では、米国の交通事故に関連するデータを分析します。これは、事故が発生しやすい場所の調査に利用でき、米国の交通事故死者に影響を与える要因を理解するのにも役立ちます。 

「現在の道路状況に関する正確で更新された情報にアクセスできることで、ドライバー、歩行者、および乗客は情報に基づいた交通安全の決定を下すことができます。」
–安全な国際道路旅行協会。

データソース

この記事で使用されているデータセットは、以下からインポートされています。

  1. Kaggle
  2. NHTSAの致命的な衝突データセット

全国の交通事故データセットは約49の州をカバーし、2016年2020月から3.5年XNUMX月までに収集されたデータが含まれています。XNUMX万件のレコードが含まれており、データは複数のデータプロバイダーから収集されています。 XNUMXつのAPI(アプリケーションプログラミングインターフェイス)–MapQuestトラフィックとMicrosoftBing Mapトラフィックは、ストリーミングトラフィックイベントデータを提供するために使用されています。 

これらのデータセットは両方ともオープンデータセットであり、データサイエンスコミュニティで利用できます。  

データ解析 

データはPythonを使用して分析され、PowerBIで視覚化されています。

時刻

  • 仮説:ほとんどの事故は早朝または深夜に発生します
  • 分析されたデータ:事故の時間
  • 観測:事故のピークは午前7時53分頃に観測されました。

交通事故に関しては、最初の仮説は、ほとんどの事故は早朝のラッシュアワーまたは深夜に発生した可能性が高いというものでした。 事故の時があるので、仮説を検証することができます。

JupyterノートブックでPythonを使用して2016年2020月から7年53月までの交通事故データセットを調べたところ、ほとんどの事故は午前XNUMX時XNUMX分頃に発生しているようです。 

各場所での事故の時刻は現地時間であるため、現地のタイムゾーンを考慮する必要のある標準のタイムゾーンに変換するためのバリエーションはありません。

気象条件

  • 仮説:気象条件は交通事故に影響を与える
  • 分析データ:事故時の気象条件
  • 観測:晴天時に事故のピークが観測された

時間帯は別として、気象条件は、事故を引き起こした可能性のあるものに関する48番目の仮説です。 データセットには、事故時のさまざまな気象条件が含まれています。 気象条件は、交通事故の主要な影響要因とは見なされません。 データによると、事故の約XNUMX%は、天候が晴れて晴れているときに発生します。

上位6つの気象条件は、「晴れた」気象条件でもかなりの数の事故が発生していることを示しています。

NHTSAの死亡者データには、米国の各年の死亡者数に関するさまざまな情報が含まれています。 このプロジェクトでは、2010年から2019年までのデータが分析のために考慮されました。

主な所見:

年別の死亡者数

NHTSAの死亡率データを分析すると、2016年以降、米国の死亡者数は着実に減少していることがわかります。

州別の死亡者数

2017年からの死亡者数の変化率は-2%でしたが、5年には5つの都市で2018%を超える死亡率の変化が見られました。ニューハンプシャー州が最も高く吸収し、死亡者数は44%増加しました。 100,000年の人口2018万人あたりの致死率は11.2でした。 しかし、27州のうち52州の死亡率は、全国の死亡率よりも高かった。 

月別の死亡者数

2016年間の致命的な事故データを見ると、2016月は72年を除いて致命的な事故の発生が最も少なかった。XNUMX年のXNUMX月は、同じ年のXNUMX月と比較してXNUMX件の致命的な事故の増加を観察した。

致命的な事故の発生率が最も高かったのは2017年を除いて130月で、XNUMX月が最も多く発生しました。同じ年のXNUMX月よりもXNUMX件多くの致命的な事故が発生しました。

性別による死亡者数

71年の死亡者の2018%は男性でした。

年齢別の死亡者数

25歳から34歳までの人々は他の年齢層よりも多くの死者を出しました。

アルコール関連の死亡者

28%、つまり2018年の死亡者の約9分の3はアルコール関連でした。 ほとんどのアルコール関連の死亡者は午後XNUMX時から午前XNUMX時の間に発生しました。

ただし、アルコール関連の事故は2年から2012年にかけて2018%減少しました。

両方のデータセットの分析から、次のように結論付けることができます。

  1. 交通事故による死亡者数は、2016年の最後の高記録以来減少し続けています。
  2. 交通事故死者の約XNUMX分のXNUMXは、飲酒運転が原因です。
  3. アルコール関連の死亡者は、午後9時から午前3時の間にさらに発生しました。
  4. ほとんどの事故は天候が晴れて晴天のときに発生するため、天候は交通事故にほとんど影響を与えません。
  5. 2年の死亡者数は2018%減少しましたが、ニューハンプシャー州では5年の5人の死亡者数から44%増加し、2017つの都市で102%を超える死亡者数の増加が見られました。

そのような事故の正確な場所がわかれば、POI(Point of Interest)に基づいてアルコール関連の死亡者を分析することができます。 これは、アルコール関連の死亡者がバーやレストランの特定の半径内で発生する可能性が高いかどうかを判断するのに役立ちます。

事故の正確な地理的位置に関するデータにアクセスすることで、各市/郡の最も致命的な交通事故の場所を時間帯と週ごとに視覚的にマッピングおよびプロットできます。

車両の動きに関するデータにアクセスすることで、事故/死亡事故が発生したときにドライバーが試みていた動きの種類に関する情報を取得できました。たとえば、左折、右折などです。

この分析に使用されるすべてのコードはGitHubで入手でき、次の場所にあります。 githubの.

タグ

ハッカー正午に参加

無料のアカウントを作成して、カスタムの読書体験のロックを解除します。

コインスマート。 BesteBitcoin-ヨーロッパのBörse
ソース:https://hackernoon.com/analyzing-data-from-us-road-accidents-with-data-visualization-f05735ne?source = rss

スポット画像

最新のインテリジェンス

スポット画像