-
visualizing data
Visualizing data Contents 탐색적 자료 분석 Data to Image 다양한 툴과 차트 마치며 참고자료 탐색적 자료 분석 “the greatest value of picture is when it forces us to notice what we never expected to see” 위는 ‘존 튜키’ 라는 통계학자의 발언으로, 그림의 가장 위대한 가치는 우리가 예상하지 못한 것을 알려줄 때 라고 말하고 있습니다. 탐색적 자료 분석 (Exploratory Data Analysis) 는 ‘존 튜키’ 라는 통계학자가 창안한 자료 분석 방법으로, 시각적 방법으로 주요 특성들을 알아내기 위해,...
-
Web Crawling & Scraping
Web Crawling & Scraping Contents 웹 크롤링 & 스크레이핑이란? Beautiful Soup 사용법 로그인 및 크롤링 다양한 웹 데이터 형식 마치며 참고자료 웹 크롤링 & 스크레이핑 이란? 데이터 과학이나 머신러닝 분야에 관심이 많은 학생이라면 데이터를 구하는 과정에 있어서 적지 않은 어려움을 겪었던 적이 있었을 것이다. 많은 가공된 오픈 데이터들을 요즘은 쉽게 얻을 수 있지만, 막상 실제 데이터 분석작업을 해보려고 하거나, 실제 프로젝트를 진행해보려고 하면 원하는 오픈 데이터를 쉽게 찾기는 어렵기 마련이다. (오픈 데이터란 자유롭게 다운받고 사용할...
-
Data Forecast
Data Forecast contents What is Data Forecast? Basic Concepts what is STL Decomposition? Data Forecast methods conclusion What is Data Forecast? Data Forecast 란 무엇인가? 데이터 예측은 많은 경우에 필요하고 그 중요성 또한 크다고 할 수 있다. 만약 돌에 걸려 넘어지게 되었을 때, 그 결과를 예측해보면 쉽게 ‘다칠 것이다’라고 말할 수 있다. 하지만 자율주행 자동차를 제작한다고 생각해보자 자동차가 빠른속도로 다가오는 트럭을 상대로 미래를 예측해야 하는 상황이 생길 것이다. 관측 가능한 모든 데이터를 고려해보자 자동차의 현재...
-
data science 매출분석
DataScience - 2 Contents 1. Review 2. Task 3. Data visualization 4. Data analysis 5. Predict 6. Conclusion 1. Review 이전 포스팅에서 데이터 사이언스가 어떤 주제인가를 다루었다. 실제로 매우 유명한 데이터셋을 가지고 데이터를 import 하는거에서 부터 plotting, check outlier 등 가장 기본적인 tool의 사용법을 익혔다. 유명한 데이터셋이기 때문에, 어떤 방법이 옳고 효율적인지를 직관적으로 이해할 수 없었다. 이번에는 좀 더 발전해서, 많이 접해보지 못했던 데이터셋에 대해서 어떻게 data 를 직관적으로 visualize 하고 analysis 할지를 알아보고자 한다....
-
data science 기초
Data Science 의 기초 contents what is data science? ready to start analysis feature check outliers PCA linear regression conclusion what is data science? 데이터 과학이란? 이번 주제에서는 데이터 과학이라는 분야를 다뤄보고자 한다. 딥러닝이 현재 큰 인기와 관심이 주목된 가운데, 데이터과학의 중요도 또한 크게 중요해지고 있다. 데이터들이 중요한 이유는 무엇일까? AI(인공지능)는 learning 을 통해서 자신의 내부 computation을 견고하게 만들고, 그 learning은 다름이 아닌 data들의 집합을 통해서 이루어진다. 여러가지 예를 들 수 있겠지만 image classification 이라는...