- 피어슨 상관계수 : 가장 흔하게 사용되는 상관계수 중 하나도, 두 변수 간의 선형 관계를 측정한다. -1부터 1까지의 값을 가지며, 1에 가까우면 양의 선형 관계, -1에 가까우면 음의 선형 관계를 갖는다.
- 두 변수 간의 **선형 관계(linear relationship)**를 측정합니다.
- 값 자체(원시 값)에 기초하여 계산됩니다.
- 데이터가 정규 분포를 따르고 선형적 관계가 있는 경우 더 유용합니다.
- 스피어만 상관계수 : 변수 간의 순위 관계를 기반으로 하는 비모수적인 상관계수이다. 데이터의 순위를 사용하므로 비선형이거나 비정규 분포를 가질 때에도 적용 가능하며, 상대적으로 이상치에 대해 민감하지 않다.
- 두 변수 간의 단조(monotonic) 관계를 측정합니다.
- 순위(rank)에 기반하여 계산되므로 비선형적 관계도 포착합니다.
- 이상치(outliers)에 덜 민감합니다.
언제 스피어만 상관계수를 사용?
- 비선형적인 관계:
- 두 ETF 종가 간에 일정한 증가 또는 감소 추세는 있지만, 그 관계가 선형적이지 않을 때.
- 예: 한 ETF의 종가가 증가하면 다른 ETF의 종가도 증가하지만, 비례적으로 증가하지 않는 경우.
- 이상치(outliers)
- 종가 데이터에서 갑작스러운 큰 변동(예: 급등 또는 급락)이 발생할 경우. 스피어만 상관계수는 순위를 기반으로 계산하기 때문에 이상치에 민감하지 않다.
- 단조(monotonic) 관계 분석:
- 두 ETF의 종가가 항상 같은 방향(증가 또는 감소)으로 움직이는지를 확인하고 싶을 때.