주가 경향성 분석
1. 비지도 학습 모델 적용 과정
비지도 학습은 주가 데이터의 숨겨진 패턴을 찾는 데 사용됩니다.
- 클러스터링 적용: 주가 데이터를 기반으로 K-means나 DBSCAN 같은 클러스터링 기법을 사용하여 비슷한 움직임을 보이는 ETF들을 그룹화합니다. 이를 통해 시장에서 특정 ETF들이 어떻게 유사한 패턴을 보이는지 분석할 수 있습니다.
- 결과 해석: 클러스터링 결과를 해석해, 각 클러스터의 ETF들이 공통적으로 가지는 특성을 분석합니다. 예를 들어, 특정 클러스터의 ETF들이 비슷한 산업에 속해 있거나, 비슷한 시기에 가격이 반등하는 경향을 보일 수 있습니다.
이런 방식으로 각각의 방법론을 ETF 주가 경향 분석에 구체적으로 적용할 수 있습니다.
- 비슷한 움직임이라고 어떻게 판단할 것인가?
-
수익률 계산: ETF의 수익률은 주가의 변동성을 분석하는 데 중요한 데이터입니다. 주가 데이터에서 일일, 주간, 월간 수익률을 계산하여 ETF의 가격 변동 패턴을 파악합니다.
-
유사성 측정: ETF의 수익률 시계열 데이터가 비슷한지 측정하는 방법으로는 상관계수와 거리 기반 측정이 있습니다.
- 상관계수 (Correlation Coefficient):
- 두 ETF의 수익률 간의 상관계수를 계산하여 유사성을 측정합니다. 상관계수가 높을수록 두 ETF의 가격 움직임이 유사하다고 할 수 있습니다.
- 거리 기반 측정:
- 유클리드 거리 (Euclidean Distance): ETF의 수익률 벡터 간의 거리로 유사성을 측정합니다. 거리가 짧을수록 ETF의 움직임이 비슷하다고 할 수 있습니다.
-
K-means 클러스터링:
- 특징 선택: 각 ETF의 수익률 데이터를 클러스터링 모델의 입력 데이터로 사용합니다.
- 군집 수 결정: K-means에서 군집의 수(K)를 결정합니다. 이는 엘보우 기법이나 실루엣 분석 등을 통해 선택할 수 있습니다.
- 모델 학습: K-means 알고리즘을 사용하여 클러스터링을 수행합니다.
-
DBSCAN 클러스터링:
- 매개변수 설정: DBSCAN의 경우, 거리 기반의 군집화로 ε(입실론)과 최소 샘플 수(min_samples)를 설정합니다.
- 모델 학습: DBSCAN을 사용하여 클러스터링을 수행합니다
클러스터링 결과 해석
- 각 클러스터 분석:
- 클러스터 내 ETF의 특성: 각 클러스터에 속한 ETF들의 공통된 특성을 분석합니다. 예를 들어, 특정 클러스터의 ETF들이 비슷한 산업군에 속하거나, 특정 시장 상황에서 비슷한 가격 변동을 보일 수 있습니다.
- 산업 및 시기 분석: 클러스터링 결과를 바탕으로 ETF들이 공통적으로 속한 산업군이나, 특정 시기에 비슷한 패턴을 보이는지 분석합니다.