본문 바로가기

Study/Tableau

Tableau | TWBX | 주식 트렌드 시각화 - 데이터 수집

데이터 시각화가 주무기였으나

태블로를 사용한지 너무 오래되어 다시 공부가 필요하다고 생각하던 요즘.

감사하게도 TWBX 4기 수업을 참여하여 수월하게 태블로 공부를 할 수 있게 되었다. 

 

 

Overview

첫번째로 구성했던 대시보드는, 주식 트렌드 시각화였다.

우선 분석하고자 하는 주식 종목을 선택했다.

필자는 ETF 종목 중 SPY, QLD의 트렌드를 보고싶어 해당 종목을 선택했다.

사용했던 도구는 구글 시트태블로 퍼블릭(데스크탑 버전)

 

대시보드 생성 순서를 간략하게 정리하면,

  1. 구글 스프레드 시트에 원하는 종목의 데이터들을 가져온다.
  2. 태블로에 구글 스프레드 시트의 데이터를 연결하여 EDA를 거친다.
  3. 불연속형 날짜값을 열에 배치, 종가를 행에 배치하여 라인차트를 생성한다.
  4. 필요에  따라 이중축, 계산식 필드를 사용한다.
  5. 추가적인 시각화 작업들을 한다. (마크 설정, 크기 및 색상 설정, 세부 사항 및 도구 설명 설정, 주석 추가)

 

데이터 수집

구글 스프레드 시트에 주식 데이터를 수집하는 방법은 두가지가 있다.

  1. GOOGLEFINANCE 함수 이용
  2. IMPORTHTML 함수 이용

GOOGLEFINANCE 함수

= GOOGLEFINANCE([종목], [속성], [시작날짜], [종료날짜]) 의 파라미터들로 사용한다.

해당 함수를 사용하여 아래 첨부 사진과 같은 결과를 확인할 수 있다.

참조 : GOOGLEFINANCE 공식 문서

 

 

IMPORTHTML 함수를 사용하기 위해서는 웹크롤링을 위해 원하는 페이지의 html 을 확인해야 한다.

필자는 네이터 주식을 통해 원하는 종목의 페이지로 랜딩한 후, 원하는 데이터가 담겨진 태그 블럭을 확인했다.

 

여기서 참고할 값들은 해당 페이지의 url과 데이터가 담긴 블럭, 즉 태그 속성값이다.

= IMPORTHTML([Url], [태그 속성], [태그 순서]) 의 파라미터로 사용한다.

해당 함수를 사용하여 아래 첨부 사진과 같은 결과를 확인할 수 있다.

참조 : IMPORTHTML 공식 문서

 

데이터 로드

public 버전은 연결하는 커넥터가 제한적이다.

태블로를 열고 google drive 서버에 연결하여 구글 시트에 수집한 데이터를 로드해온다.

 

데이터 원본 페이지에서 간단한 데이터 처리를 수행한다. 

시각화할 데이터, 여기에서는 사용할 시트를 선택해준 후 데이터를 탐색한다.

데이터 형을 변환하거나 필요없는 컬럼을 숨기거나, 해당 단계에서 계산식 필드를 사용할 수도 있다.

 

IMPORTHTML 함수로 데이터를 수집해준 시트의 경우, 중간의 공백열들이 있어서 null값이 들어온 것을 확인할 수 있다.

이때 좌측패널의 데이터 해석기 사용 체크박스를 누르면 태블로가 데이터를 재정립해준다.

 

 

다음 포스팅 : 주식 트렌드 시각화 - 데이터 시각화

 


Resource

 

데이터 수집 영상 - https://youtu.be/ekJ3utB_-Uo

하이브 주식 구글 시트로 수집 및 시각화 예시 영상 - https://youtu.be/GTrDd_t34-k

네이버와 카카오 주식 수집 및 시각화 영상 - https://youtu.be/_pEyIHdTg9I