Hierarchical Risk Parity (HRP) 8. Linkage Matrix
Linkage Matrix는 Hierarchical Clustering에서 사용되는 특별한 행렬의 일종이다.
Matrix의 각 행이 하나의 link를 의미하며, 각 열은 link에 대한 정보를 담고 있다.
array([[ 0. , 1. , 1. , 2. ],
[ 3. , 4. , 1. , 2. ],
[ 6. , 7. , 1. , 2. ],
[ 9. , 10. , 1. , 2. ],
[ 2. , 12. , 1.29099445, 3. ],
[ 5. , 13. , 1.29099445, 3. ],
[ 8. , 14. , 1.29099445, 3. ],
[11. , 15. , 1.29099445, 3. ],
[16. , 17. , 5.77350269, 6. ],
[18. , 19. , 5.77350269, 6. ],
[20. , 21. , 8.16496581, 12. ]])
https://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.leaders.html
이때 각 link의 열 각각은
[0. 첫 번째 원소의 번호,
1. 두 번째 원소의 번호,
2. 두 원소 사이의 거리,
3. 이 link 아래에 있는 원소의 수(link 제외)]를 포함한다.
따라서 link[1,0]은 1번째 link에서 첫 번째 원소의 번호, link[15, 3]은 15번째 link 아래에 있는 모든 원소의 수를 의미한다. (대부분의 콤-퓨타는 시작 번호가 0이다.)
이때 각 link 또한 n+1, n+2 식으로 번호를 부여받는다. (n은 asset의 개수)
따라서 n=5일때
link[3,0]=5,
link[3,1]=7 인 경우,
4번째 링크(이 link의 번호는 8)는 5번 link (첫 번째 링크)와 7번 link (세 번째 링크)를 연결하는 link이다~ 라는 식으로 해석할 수 있다.