데이터 시각화가 주무기였으나
태블로를 사용한지 너무 오래되어 다시 공부가 필요하다고 생각하던 요즘.
감사하게도 TWBX 4기 수업을 참여하여 수월하게 태블로 공부를 할 수 있게 되었다.
Overview
첫번째로 구성했던 대시보드는, 주식 트렌드 시각화였다.
우선 분석하고자 하는 주식 종목을 선택했다.
필자는 ETF 종목 중 SPY, QLD의 트렌드를 보고싶어 해당 종목을 선택했다.
사용했던 도구는 구글 시트와 태블로 퍼블릭(데스크탑 버전)
대시보드 생성 순서를 간략하게 정리하면,
- 구글 스프레드 시트에 원하는 종목의 데이터들을 가져온다.
- 태블로에 구글 스프레드 시트의 데이터를 연결하여 EDA를 거친다.
- 불연속형 날짜값을 열에 배치, 종가를 행에 배치하여 라인차트를 생성한다.
- 필요에 따라 이중축, 계산식 필드를 사용한다.
- 추가적인 시각화 작업들을 한다. (마크 설정, 크기 및 색상 설정, 세부 사항 및 도구 설명 설정, 주석 추가)
데이터 수집
구글 스프레드 시트에 주식 데이터를 수집하는 방법은 두가지가 있다.
- GOOGLEFINANCE 함수 이용
- IMPORTHTML 함수 이용
GOOGLEFINANCE 함수는
= GOOGLEFINANCE([종목], [속성], [시작날짜], [종료날짜]) 의 파라미터들로 사용한다.
해당 함수를 사용하여 아래 첨부 사진과 같은 결과를 확인할 수 있다.
참조 : GOOGLEFINANCE 공식 문서
IMPORTHTML 함수를 사용하기 위해서는 웹크롤링을 위해 원하는 페이지의 html 을 확인해야 한다.
필자는 네이터 주식을 통해 원하는 종목의 페이지로 랜딩한 후, 원하는 데이터가 담겨진 태그 블럭을 확인했다.
여기서 참고할 값들은 해당 페이지의 url과 데이터가 담긴 블럭, 즉 태그 속성값이다.
= IMPORTHTML([Url], [태그 속성], [태그 순서]) 의 파라미터로 사용한다.
해당 함수를 사용하여 아래 첨부 사진과 같은 결과를 확인할 수 있다.
참조 : IMPORTHTML 공식 문서
데이터 로드
태블로를 열고 google drive 서버에 연결하여 구글 시트에 수집한 데이터를 로드해온다.
데이터 원본 페이지에서 간단한 데이터 처리를 수행한다.
시각화할 데이터, 여기에서는 사용할 시트를 선택해준 후 데이터를 탐색한다.
데이터 형을 변환하거나 필요없는 컬럼을 숨기거나, 해당 단계에서 계산식 필드를 사용할 수도 있다.
IMPORTHTML 함수로 데이터를 수집해준 시트의 경우, 중간의 공백열들이 있어서 null값이 들어온 것을 확인할 수 있다.
이때 좌측패널의 데이터 해석기 사용 체크박스를 누르면 태블로가 데이터를 재정립해준다.
다음 포스팅 : 주식 트렌드 시각화 - 데이터 시각화
Resource
데이터 수집 영상 - https://youtu.be/ekJ3utB_-Uo
하이브 주식 구글 시트로 수집 및 시각화 예시 영상 - https://youtu.be/GTrDd_t34-k
네이버와 카카오 주식 수집 및 시각화 영상 - https://youtu.be/_pEyIHdTg9I
'Study > Tableau' 카테고리의 다른 글
Tableau | TWBX | 기온 분포 시각화 - 동작 추가 (0) | 2023.03.05 |
---|---|
Tableau | TWBX | 기온 분포 시각화 - 참조선 활용 (0) | 2023.03.05 |
Tableau | TWBX | 기온 분포 시각화 - 데이터 탐색 (0) | 2023.03.04 |
Tableau | TWBX | 주식 트렌드 시각화 - 데이터 시각화 (0) | 2023.03.03 |