전체 글 47

데이터 분석가의 강력 추천 도서_업데이트 중

분석에 대한 관점 가설이 무기가 된다 뭐가 됐든 데이터부터 봐보자 라는 요청에 대응하는 방법 비즈니스 마케팅설계자 퍼널을 제대로 설계하는 방법: 아이디어 불패의 법칙 대부분의 아이디어는 처음부터 가능성이 없었기에, 잘 만들어서 마케팅을 잘하더라도 실패한다. 그래서 아이디어가 가능성 있는지 제대로 된 데이터로 검증을 해야한다. 이때 적절한 데이터는 FGI나 시장조사 등이 아니라, 프리토타이핑 같은 방법으로 실제 시장에서 얻은 데이터이어야 한다. 새로운 지식을 효과적으로 공부하는 방법 어떻게 공부할 것인가 전통적인 학습법은 짧은 시간 내에 1회에서 여러번 반복하는 읽기이다. 오래 전부터 반복읽기가 강조되었으나, 여러 실험을 통해 효과가 낮다고 검증되었다. 한번 읽은 사람과 여러번 읽은 사람이 시험을 보면 여..

카테고리 없음 2024.03.18

조회수 10만이 나올 수 밖에 없는 유튜브 주제 정하는 방법

유튜브, 블로그, 인스타 등 새로운걸 시작할 때 주제를 못 정하는 사람들을 위한 글이다. ​ 글의 내용은 유튜브가 그 대상이지만, 블로그나 인스타에 적용할 수 있다. 이 방법은 내 뇌피셜이 아니라, 구독자 몇만, 몇십만 유튜버들의 방법 2~30개를 정리한 글이다. 즉 실제로 검증된 방법이다. ​ 이미 성공적으로 블로그나 유튜브, 인스타를 운영하고 있는 사람들은 보지 마라. 글이 길다. ​ ​ ​ 세줄 요약 반드시 주제는 나와 관련있는 주제를 해라. 영상은 사람들이 많이 보는 영상을 벤치마킹해서 만들어라. 여러개 해서 가장 잘되는 주제가 너의 주제이다. ​ ​ ​ 돈을 많이 벌고 유명해지기 위해 유튜브를 시작하려는 사람이 많다. 그런데 막상 시작하려면 어떤 주제로 시작할지 막막하다. ​ 그래서 이런 저런 ..

기타 2024.01.05

리눅스 서버시간 KST 한국시간으로 변경

리눅스를 사용할 때 cron등 사용하기 위해 서버시간을 변경해야할 일이 있습니다. 매번 찾아다니기 귀찮아서 이번에 세팅한 김에 기록을 남깁니다. 현재 시간대 확인 현재 세팅된 시간대를 확인하는 방법은 date 입니다. 저는 한국으로 변경해서 KST로 나오는데, 세팅하지 않았다면 일반적으로 UTC입니다. 리눅스 서버시간을 KST로 변경하는 법 sudo timedatectl set-timezone Asia/Seoul 만약 위의 방법이 안된다면 아래 방법으로 해보세요 ln -sf /usr/share/zoneinfo/Asia/Seoul /etc/localtime crontab 재시작 서버시간 변경 후에는 crontab을 재실행해주셔야 변경된 시간대에 맞춰 실행됩니다. sudo service cron restart

기타 2023.03.20

python 웹툰 크롤링 시리즈3: 카카오페이지

웹툰 크롤링 시리즈 마지막 편은 카카오페이지이다 카카페의 전체 작품의 시리즈ID, 작품명, 장르, 작가, 연령가, 조회수, 마지막연재일, 연재상태 정보를 가져오는 코드이다 카카페는 GraphQL을 통해 데이터를 요청해야해서 코드가 길다 import openpyxl import requests from tqdm import tqdm import time ## 전체작품 url = 'https://page.kakao.com/graphql' query = '''query staticLandingGenreSection($sectionId: ID!, $param: StaticLandingGenreParamInput!) { staticLandingGenreSection(sectionId: $sectionId, par..

파이썬 2023.03.19

python 웹툰 크롤링 시리즈2: 카카오웹툰

카카오웹툰에 현재 서비스 중인 연재작품과 완결작품 정보를 수집하는 코드이다 시리즈ID, 작품명, 저자, 출판사, 성연작품여부, 조회수, 좋아요수, 연재상태를 가져온다 import json import openpyxl import requests from tqdm import tqdm import time from bs4 import BeautifulSoup def epi_info(series_id, state): epi_url = 'https://webtoon.kakao.com/content/text/' + str(series_id) epi_res = requests.get(epi_url) soup = BeautifulSoup(epi_res.content, 'html.parser') result = so..

파이썬 2023.03.18

python 웹툰 크롤링 시리즈1: 네이버웹툰

네이버에 현재 서비스 중인 모든 웹툰을 크롤링해서 결과를 엑셀 파일로 저장하는 코드이다 가져오는 정보는, 시리즈ID, 작품명, 저자, 성인작품여부, 별점, 연재요일 등이 있다 import openpyxl import requests from tqdm import tqdm import time def series_info(series_id): '''시리즈ID를 입력받아, 장르와 관심수를 반환한다''' series_info_url = 'https://comic.naver.com/api/article/list/info?titleId=' + str(series_id) series_res = requests.get(series_info_url) series_info = series_res.json() try: f..

파이썬 2023.03.17

부동산 투자의 기초와 마인드: 운명을 바꾸는 부동산 투자 수업 (기초편)

부동산 투자에 대해 공부하기 위해 기초적인 내용을 다룬 '운명을 바꾸는 부동산 투자 수업 (기초편)' 책을 읽고 정리한 내용입니다. 부동산에 대해 잘모르는 초보자 분들이 읽기 좋은 책이고, 이 책을 통해 부동산 투자의 기초적인 원리와 마인드를 배울 수 있었습니다. 투자 원리 부동산 시장과 물가는 장기적으로 우상향 하는 자산임 투자수익 = 투자금 X 수익률 투자실력이 부족하면 투자금을 늘려야한다 부동산 투자의 두가지 방향 일정한 현금흐름이 있으면, 수익률을 높이는게 두번째 → 시세차익형 투자 시세차익 아파트 투자가 메인 → 거래가 활발해야 하기 때문이다 월세수익형 투자보다 시세차익형 투자가 쉽다 공실걱정이 적다 여차하면 내가 직접 거주하면 된다 투자금 대비 월세 수익은 적다 일정한 현금흐름이 없으면, 일정..

2022.06.22

머신러닝 모델 개발의 교과서: 머신러닝 파워드 애플리케이션

머신러닝 파워드 애플리케이션 간단 요약 이 책만의 차별점 모델링 이론 혹은 라이브러리 튜토리얼에 초점을 맞춘 다른 책들과 달리, 머신러닝 애플리케이션 기획, 모델링, 배포, 모니터링, 개선까지 전체적인 사이클을 따라해볼 수 있을 정도로 구체적으로 설명 주관적인 인사이트 머신러닝 서비스를 만드는 과정도 린하게 보는 관점이 재미있었습니다. 데이터 분석 과정도 동일한 맥락일 것 모델 뿐만 아니라, 데이터셋도 린하게 개선해야하는 대상 머신러닝이 모든 문제를 해결하는 만능도구가 아니라는 것을 확실하게 인지 머신러닝, 마케팅, 기획 등등 모든 일은 결국 비즈니스 성과 개선을 위한 것이다 저자 현재 스트라이프에서 머신러닝 엔지니어링 담당, 데이터 과학 및 엔지니어 분야 멘토링 진행 스트라이프: 글로벌 결제 핀테크 기..

2022.06.21

구름 IDE: 항상켜두기를 제공하는 무료 서버

무료 클라우드 개발환경 구름 IDE 서비스를 배포하거나 배치 작업이 필요한 경우 로컬 컴퓨터를 켜둬야 하는 경우가 있다 서비스의 규모가 크다면 AWS 등을 고려해야겠지만, 규모가 작다면 구름IDE를 추천한다 왜냐하면 시간 제한없이 무료로 사용할 수 있고, 항상 켜두기 또한 제공하기 때문이다 예전에는 클라우드IDE 환경은 무료로 제공했지만, 항상 켜두기 기능은 유료플랜을 이용해야했다 그런데 5월 22일 릴리즈부터 항상 켜두기 무료 제공으로 변경되었다 이제 간단한 서비스를 배포하거나, 배치작업을 돌릴 때 간편하게 할 수 있다 기존에는 AWS 무료플랜을 이용하거나, 오라클클라우드를 사용했었는데 막상 써보니 구름이 훨씬 편하다 컨테이너를 생성할 때 서울 리전도 설정할 수 있고, 비공개로 세팅이 가능하다 지원하는..

기타 2022.06.20