본문 바로가기

Study/Tableau

Tableau | TWBX | 기온 분포 시각화 - 데이터 탐색

TWBX 1주차 수업에서 기온 분포 시각화를 통해

- 데이터 탐색 및 처리

- 계산식 필드 활용 

을 배울 수 있었다.

 

 

1. 원본 데이터 구조 파악

이번에 활용할 데이터는 기상청의 기온 데이터. 엑셀로 받은 후 데이터를 탐색한다. 

연도별 시트로 구성되어있고 열은 월, 행은 일자로 구성되어있다.

시트마다 가장 마지막 행은 월 평균 기온을 나타내는 구조이다.

 

2. 데이터 가공

연도 시트들을 모두 선택하여 테이블로 끌어온다.

해당 동작으로 시트들이 유니온 처리된다. 필드 형식이 같은 경우 유니온이 가능하다.

 

날짜별 기온값을 보기 위해, 태블로 상에서 피봇팅을 해준다.

1~12월 필드들을 함께 선택해준 후, 피벗을 실행한다.

 

피벗이 잘 된 걸 확인할 수 있다.

필요 없는 필드들은 숨김 처리하고 필드명 이름을 변경하여 사용성을 높여준다.

 

연도, 월, 일 값들을 '날짜' 필드로 한번에 묶어서 활용하고자 한다.

컬럼 헤더의 드롭다운 박스를 이용, 계산된 필드를 만들어 준다.

DATEPARSE 함수를 이용하여 문자열을 날짜형식으로 변환시켜 준다. 이 때, MM은 월, mm은 분을 나타내므로 대소문자 사용에 주의가 필요하다. 

그리고 일별 기온 분포를 보고자 하므로 날짜시간 형식이 아닌 날짜 혀식을 사용하기 위해 DATE 함수로 한 번 더 감싸주었다.

 

'평균'값 역시 일 필드의 값으로 책정되므로 해당 값과 중간 중간 비어있는 값들을 처리해준다.

 

우측 상단, 필터를 추가하여 null 값을 필터링 해준다.

 

같은 방법으로 최저 기온도 null 값을 제외처리 한다.

 

필터의 추가로 약 2만개 가량의 행이 제거된 것을 확인할 수 있다.

 

 

3. 데이터 탐색

데이터 원본 탭에서 대략적인 가공을 마치고, 시각화를 통해 좀 더 면밀하게 데이터 탐색을 실행한다.

최저 기온의 데이터 원본 형식은 문자열이었다.

때문에 테이블 패널에서 차원값과 함께 놓여있는 걸 확인할 수 있고, 드롭다운 메뉴를 통해 측정값으로 변환하여 사용해준다.

 

변환한 최저 기온 필드의 기본 집계 속성을 평균 값으로 바꾸어준다.

 

년도 별로 평균 기온을 탐색한다.

2021년 이후로 값이 급감하는 것을 확인할 수 있다.

 

년도에서 월로 좀 더 세분화하여 데이터를 파악해 본다.

2023년 2월 이후의 데이터가 비어있는 것을 확인해 볼 수 있다.

 

우측 하단의 null 부분을 우클릭하여 숨길 수 있고,

숨긴 후 데이터 원본 탭의 필터를 다시 한 번 확인해 볼 것을 추천한다.

 

연대, 즉 10년 단위로 연도 그룹을 만들어 기온 분포를 살펴보고자 한다.

위 그림처럼 그룹을 사용할 수 도 있으나, 이번에는 계산식 필드를 활용한다.

IF YEAR([날짜]) < 1970 THEN '1960년대'
ELSEIF YEAR([날짜]) < 1980 THEN '1970년대'
ELSEIF YEAR([날짜])  < 1990 THEN '1980년대'
ELSEIF YEAR([날짜])  < 2000 THEN '1990년대'
ELSEIF YEAR([날짜])  < 2010 THEN '2000년대'
ELSEIF YEAR([날짜])  < 2020 THEN '2010년대'
ELSE '2020년대'
END

위와 같은 코드로 계산식 필드를 만들어 준 후

 

만들어 둔 계산식 필드를 활용하여 차트를 만들어 준다.

 

최저 기온의 분포를 보고자 하여, 계절이라는 계산식 필드를 만들어 주었다.

 

만들어 둔 계절 값을 필터 패널에 올리고, 겨울에 해당하는 값들만 확인하여 최저 기온의 연도별 흐름을 파악할 수 있다.

추가로 축 서식을 통해 머리글 표시도 조정해주었다.

 

 

다음 포스팅 : 기온 분포 시각화 - 참조선 활용