교통사고 데이터를 활용하여 빠르게 현황을 파악하는 리포팅을 해보겠습니다.
사용한 데이터는 도로교통공단에서 관리하는 2018년 교통사고 통계 데이터입니다.
2018년 교통사고 전체 평균
2018년 전체의 평균 교통사고 발생건수는 위와 같습니다. 평균적으로, 발생건수는 약 79건, 사망 1명, 부상자수 117명, 중상 27건, 경상 83건, 부상신고 8건입니다.
주목할만한 점으로 3가지가 있습니다.
1) 평균부상자수는 평균발생건수보다 높은 것
2) 경상은 중상보다 약 3배 많은것
3) 부상신고는 발생건수의 약 10% 정도인 것
월별
그룹화를 하여 보다 자세하게 월별로 데이터를 살펴보겠습니다.
6가지 항목 중 부상신고를 제외한 모든 항목에서, 10월은 가장 많은 비중을 차지합니다.
부상신고 항목에서는 8월이 평균 9건으로 가장 많은 비중을 차지하는 것을 확인할 수 있습니다.
지역별
시도별로 살펴보겠습니다.
6가지 항목 전부에서 경기도는 가장 많은 비중을 차지하고 있습니다.
서울은 6가지 항목 중 사망자수를 제외한 나머지 항목 전부에서 두번째로 비중을 많이 차지하고 있습니다.
지역을 시군구로 보다 세분화하여 살펴보겠습니다.
발생건수, 부상자수, 중상, 경상 항목에서 서구는 가장 많은 비중을 차지합니다.
사망자수에서는 청주시, 부상신고에서는 용인시가 가장 많은 비중을 차지하고 있습니다.
지역별로 살펴볼 경우, 해당 지역의 인구수를 고려해 보다 의미있는 분석을 할 수 있지만, 이번 리포트에서는 지역별 인구수는 고려하지 않았습니다.
발생시간대
시간대별로 살펴봤을 때,
모든 항목에서 18-20시가 가장 많은 비중을 차지합니다.
사고유형
사고유형을 살펴보겠습니다.
모든 항목에서 차대차 유형은 가장 많은 비중을 차지했습니다.
주목할만한 점으로,
1) 사망자수 항목에서, 차대차 유형과 차대사람 유형은 비슷한 정도의 비중을 차지하는 것을 확인할 수 있습니다.
2) 부상자수 항목에서, 차대차 유형이 압도적으로 많은 비중을 차지하는 것을 확인할 수 있습니다.
보다 세분화하여 살펴봤을 때,
사망자수를 제외한 모든 항목에서는 측면충돌 유형이 가장 많은 비중을 차지하고,
사망자수 항목에서는 기타 유형이 가장 많은 비중을 차지합니다.
도로형태별
도로형태에 따라 살펴보겠습니다.
모든 항목에서 기타단일로 유형은 가장 많은 비중을 차지하는데, 다른 항목들과 상당히 많은 비중 차이가 있는 것을 확인할 수 있습니다.
가해운전자 연령층별
가해 운전자의 연령층별로 세분화하여 살펴봤을 때,
51세~60세 연령층은 모든 항목에서 가장 많은 비중을 차지합니다.
주목할만한 점은
20세 미만의 연령층이 운전한 경우도 모든 항목에서 2.5% 이상의 비중을 차지하는 것을 확인할 수 있습니다.
여기까지 2018년 교통사고 데이터의 전반적인 특성을 리포팅해봤습니다.
다양하고 엄밀한 분석보다는 전반적인 특성을 확인하는데 중점을 뒀기에, 이를 고려하시길 당부드립니다.
감사합니다.
'데이터 분석' 카테고리의 다른 글
Matrix Factorization 알고리즘을 사용한 상품 추천 (0) | 2021.01.13 |
---|---|
[kaggle]유튜브 인기 동영상 데이터 분석(파이썬) (2) | 2020.02.26 |
카톡 분석 : 파이썬 (0) | 2019.11.28 |
알바몬 분석: 알바몬 경기의 공고수는 몇개나 될까 (0) | 2019.08.18 |