차원과 측정값
차원: 숫자를 자르는 기준(범주형 데이터)/ 나눠서 볼 기준(지역별, 연도별, 성별)
측정값: 숫자(수치형 데이터) / 값(매출,수익, 배송비)/ 합계를 계산할 수 있는 경우
*order id를 합계로 보는게 아니라, 기준으로 보기때문에 차원으로 볼 수 있다.
연속형과 불연속형
연속형:연속적으로 순서가 있는 이어진 데이터, 축(Axis)
불연속형: 각각의 유니크한 header(머리글)를 가짐(개별적으로 구분되는 데이터), 오름/내림차순 정렬가능
order date(날짜)는 차원(나눠서 볼 기준)이면서 연속형이다.
집계방식
Row-level : 행기준 계산값의 합계
Aggregate : 집계
측정값은 집계(합계, 평균, 최소, 최대 등)된다
차원이 없으면 쪼개지지 않고 하나의 덩어리가 된다.
profit ratio = profit/sales
row-level profit ratio : profit/sale -> 잘못된 계산
aggregate level profit ratio : sum[(profit])/sum([sales]) -> 바른 계산 (보는 view의 수준에 맞게 계산됨)