공부 : 금융공학, 금융, 통계, 공학, 경제 등

Hierarchical Risk Parity (HRP) 8. Linkage Matrix

김문영 2022. 2. 5. 19:28

 Linkage Matrix는 Hierarchical Clustering에서 사용되는 특별한 행렬의 일종이다.
 Matrix의 각 행이 하나의 link를 의미하며, 각 열은 link에 대한 정보를 담고 있다.

array([[ 0.        ,  1.        ,  1.        ,  2.        ],
       [ 3.        ,  4.        ,  1.        ,  2.        ],
       [ 6.        ,  7.        ,  1.        ,  2.        ],
       [ 9.        , 10.        ,  1.        ,  2.        ],
       [ 2.        , 12.        ,  1.29099445,  3.        ],
       [ 5.        , 13.        ,  1.29099445,  3.        ],
       [ 8.        , 14.        ,  1.29099445,  3.        ],
       [11.        , 15.        ,  1.29099445,  3.        ],
       [16.        , 17.        ,  5.77350269,  6.        ],
       [18.        , 19.        ,  5.77350269,  6.        ],
       [20.        , 21.        ,  8.16496581, 12.        ]])

 

https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.leaders.html
 이때 각 link의 열 각각은
 [0. 첫 번째 원소의 번호,
1. 두 번째 원소의 번호,
2. 두 원소 사이의 거리,
3. 이 link 아래에 있는 원소의 수(link 제외)]를 포함한다.

 따라서 link[1,0]은 1번째 link에서 첫 번째 원소의 번호, link[15, 3]은 15번째 link 아래에 있는 모든 원소의 수를 의미한다. (대부분의 콤-퓨타는 시작 번호가 0이다.)

 이때 각 link 또한 n+1, n+2 식으로 번호를 부여받는다. (n은 asset의 개수)
 따라서 n=5일때
link[3,0]=5,
link[3,1]=7 인 경우,
 4번째 링크(이 link의 번호는 8)는 5번 link (첫 번째 링크)와 7번 link (세 번째 링크)를 연결하는 link이다~ 라는 식으로 해석할 수 있다.