데이터 3

[kaggle]유튜브 인기 동영상 데이터 분석(파이썬)

In [61]: #티스토리 업로드를 위하여 화면 크기 조절 from IPython.core.display import display, HTML display(HTML("")) 유튜브 인기 동영상 데이터 분석¶ Data Description(kaggle)¶https://www.kaggle.com/datasnaek/youtube-new by byeongjoon Context¶YouTube (the world-famous video sharing website) maintains a list of the top trending videos on the platform. According to Variety magazine, “To determine the year’s top-trending videos, Yo..

데이터 분석 2020.02.26

공공데이터 활용 - 교통사고 통계 리포트

교통사고 데이터를 활용하여 빠르게 현황을 파악하는 리포팅을 해보겠습니다. 사용한 데이터는 도로교통공단에서 관리하는 2018년 교통사고 통계 데이터입니다. 2018년 교통사고 전체 평균 2018년 전체의 평균 교통사고 발생건수는 위와 같습니다. 평균적으로, 발생건수는 약 79건, 사망 1명, 부상자수 117명, 중상 27건, 경상 83건, 부상신고 8건입니다. 주목할만한 점으로 3가지가 있습니다. 1) 평균부상자수는 평균발생건수보다 높은 것 2) 경상은 중상보다 약 3배 많은것 3) 부상신고는 발생건수의 약 10% 정도인 것 월별 그룹화를 하여 보다 자세하게 월별로 데이터를 살펴보겠습니다. 6가지 항목 중 부상신고를 제외한 모든 항목에서, 10월은 가장 많은 비중을 차지합니다. 부상신고 항목에서는 8월이 ..

데이터 분석 2019.07.18

[파이썬]웹데이터 수집(requests, jupyternotebook)

파이썬을 사용해 웹에 있는 데이터를 수집해보겠습니다. 거창하게 문법을 따지고 효율을 따지기 보다는, 간단하고 필요한 과정만 담겠습니다. 데이터를 수집할 페이지는 위키백과의 메인페이지입니다. 아래 과정에서 jupyternotebook을 사용했지만 필수가 아닙니다. 파이썬의 기본 idle로 해도 전혀 문제가 없으니, jupyternotebook이 뭔지 모르는 분들, jupyternotebook을 쓸 필요가 없는 분들은 코드만 확인하시면 됩니다. 먼저, 분석에 사용할 모듈인 requests를 설치하겠습니다. cmd를 실행하시고 pip install requests 라고 입력하시고 엔터치시면 됩니다. 엔터를 치면 이것과 비슷한 화면이 나올겁니다. 그러면 설치가 완료된 것 입니다. 이제 준비가 끝났으니 아래의 코..

파이썬 2019.07.02