피어슨 상관계수 vs 스피어만 상관계수

주식 시장 데이터는 일반적으로 비선형이다. 주가의 움직임은 수많은 요인에 의해 영향을 받기 때문에 선형 관계를 가지기 보다는 비선형 관계를 나타내는 경우가 많다.

주가는 특정 기간 동안 상승하거나 하락하는 경향이 있지만 이 경향은 시간이 지남에 따라 변화한다. 상승이 지속되다가 갑작스러운 하락이 발생하는 등의 패턴은 비선형적이다.

또한 주식 시장에서는 특정 사건이나 뉴스에 의해 급격하게 가격 변동이 발생할 수 있고, 이것 도한 비선형적이다.

실제 연구 결과에 따르면 주식 데이터의 상관관계나 회귀 분석을 수행할 때 비선형성을 고려해야 한다는 결과가 많다.

근거 논문:

[Nonlinear Dynamics in Stock Returns: A New Perspective]

[The Nonlinear Relationship Between Stock Returns and Trading Volume]

[Modeling Stock Price Volatility with Nonlinear Time Series]

[Stock Market Prediction Using LSTM Recurrent Neural Network]

즉, 주식 시장데이터는 특정기간에서는 Linearlity가 존재하기도 한다. 하지만 Linearlity가 특정하게 반복되어 발생하거나 특정 변수에 따라서 일정한 기간에는 Non-Linerlity가 존재하는 경우가 더 많은 것도 사실이다.

그렇기 때문에 ‘피어슨 상관계수’보다는 ‘스피어만 상관계수’로 수익률의 상관관계를 파악하는 것이 타당해 보인다.

(상관계수에 대한 설명은 준성이형이 잘 설명해놔서 생략)