분석 4

[kaggle]유튜브 인기 동영상 데이터 분석(파이썬)

In [61]: #티스토리 업로드를 위하여 화면 크기 조절 from IPython.core.display import display, HTML display(HTML("")) 유튜브 인기 동영상 데이터 분석¶ Data Description(kaggle)¶https://www.kaggle.com/datasnaek/youtube-new by byeongjoon Context¶YouTube (the world-famous video sharing website) maintains a list of the top trending videos on the platform. According to Variety magazine, “To determine the year’s top-trending videos, Yo..

데이터 분석 2020.02.26

알바몬 분석: 알바몬 경기의 공고수는 몇개나 될까

최근 알바를 구하기 위해, 알바몬을 보다가 궁금한 점이 생겼다. 지역별로 아르바이트를 구하는 수요가 얼마나 될까. 그래서 알바몬 채용정보의 전체 알바정보 카테고리의 데이터를 수집해 살펴보았다. 최근 1달 7월 17일 ~ 8월 17일에 해당하는 데이터 157,084건을 수집했고, 수집한 시점은 8월 17일이다. 수집한 데이터는 몇 개의 전처리 과정을 거쳐 아래와 같은 형태로 만들었다. 분석을 시작한 이유인, 지역별 공고수를 살펴보았다. 수집한 데이터에서, 서울과 경기 지역에 해당하는 공고수가 압도적으로 많은 것을 확인할 수 있었다. 부산의 공고수가 많지 않은 점이 예상 밖이다. 조금 더 자세히 살펴보자. 세부 지역별로 248개의 항목이 있어서, 상위 30개 지역을 살펴보았다. 알바 구인 게시물이 가장 많은..

데이터 분석 2019.08.18

공공데이터 활용 - 교통사고 통계 리포트

교통사고 데이터를 활용하여 빠르게 현황을 파악하는 리포팅을 해보겠습니다. 사용한 데이터는 도로교통공단에서 관리하는 2018년 교통사고 통계 데이터입니다. 2018년 교통사고 전체 평균 2018년 전체의 평균 교통사고 발생건수는 위와 같습니다. 평균적으로, 발생건수는 약 79건, 사망 1명, 부상자수 117명, 중상 27건, 경상 83건, 부상신고 8건입니다. 주목할만한 점으로 3가지가 있습니다. 1) 평균부상자수는 평균발생건수보다 높은 것 2) 경상은 중상보다 약 3배 많은것 3) 부상신고는 발생건수의 약 10% 정도인 것 월별 그룹화를 하여 보다 자세하게 월별로 데이터를 살펴보겠습니다. 6가지 항목 중 부상신고를 제외한 모든 항목에서, 10월은 가장 많은 비중을 차지합니다. 부상신고 항목에서는 8월이 ..

데이터 분석 2019.07.18

[파이썬]공공데이터포털 open API 지하철정보 활용하기(인증키발급)

안녕하세요. 이번 포스팅에서는 공공데이터 오픈API를 활용하기 위한 인증키를 발급받는 방법에 대해 설명드리겠습니다. 먼저 공공데이터포털 https://www.data.go.kr/ 에 접속합니다. 아이디가 없으신 분은 계정을 생성하시고 로그인하셔야합니다! 상단에 있는 메뉴바에서 '데이터셋-오픈API"를 선택합니다. 검색창에서 원하는 데이터명을 검색하면 됩니다. 오늘 사용할 데이터는 "국토교통부_지하철정보" 국토교통부_지하철정보를 클릭하면 세부화면이 뜹니다. 상단의 '활용신청' 버튼을 클릭합니다. 그러면 개발계정을 신청할 수 있는 페이지가 나옵니다. 시스템유형은 db 등 서버에 저장하고 사용할 경우 '서버구축'에 체크하시고, 서버에 저장하지 않고 사용하실거면 '일반'에 체크 활용목적에서 해당하는 목적에 체크..

파이썬 2019.07.14