본문 바로가기

잡담

프로젝트 고민. 종목 간 상관관계를 반영한 금융 시뮬레이션. 프로젝트 내용을 어떻게 설명할까 등.

 할 일이 많다. 레포트… 쓰고, 프로젝트 하고, 시험공부 해야 한다. 아 맞다. 매일 글도 써야 한다.

 저러고 보니까 할 게 되게 많다. 다 조금씩 하긴 해야 한다. 그래서 그냥 여기다가 정리하는 식으로, 쭉 풀어서 쓰려고 한다.

 

 일단 프로젝트 관련해서 좀 쓰고. 나중에 시험공부 관련해서 뭐 좀 써야겠다.

 

***

 

 프로젝트는 머신러닝으로 종목 피킹해서, 시뮬레이션을 통해 최적의 비율을 찾아내는 것이 목표다. 그리고 그걸 나 뿐만 아니라 다른 사람들도 이해할 수 있게 하는 게 목표이다.

 

 아 근데 내가 뭐라고 목표 잡고 팀원들한데 달리자고 부탁하냐. 이것도 웃기긴 하다. 아무튼.

 

 근데 여기서 큰 고민이 두 가지 있다. 시뮬레이션 구현을 어떻게 하냐랑, 이해한 것에 대한 설명을 어떻게 하냐.

 

 시뮬레이션은 상관관계 때문에 문제다. 두 종목 사이의 상관관계는 공분산이든 Copula든 돌릴 수 있겠는데, 이게 3개, 4개, n개로 많아질수록 뭘 어떻게 해야 할 지 모르겠다.

 각 asset 간의 Cov matrix (or vine copula)를 구할 수는 있어도, 아직까지 거기서 표본 추출을 못 하는 게 문제라는 거지.

 

 저거 해결 못 하면 자산 배분하는 파트는 아예 시뮬레이션을 못 돌린다. 아니 굳이 뭐 시뮬레이션 안 돌려도 되긴 하는데, 그래도 해보는 게 좋잖아.

 

 정 안 되면 이런 것도 할 수 있겠다.

 

 그냥 비슷한 움직임 보이는 애들끼리 묶어서 Group 1, Group 2, … n 만들고, 각 그룹별로 비중 1/n씩 둬 버리는 거다.

 그룹을 4개로 나눈다고 하면 각 그룹에 25%씩 자산 배분 하는 식으로.

 

 또 각 그룹 안에서는 또 동일 비중으로 자산 배분을 한다.

 그룹 안에 종목이 3개면 25% * 1/3, 24개면 25% * 1/24, 이런 식으로 말이다.

 

 뭐 이런 식으로 하면 굳이 시뮬레이션을 안 돌려도 되긴 하는데…. 이게 시뮬레이션보다 좋은 결과를 낳을 것 같진 않다. 아무튼 Optimize된 건 아니잖아.

 

 그래서 되도록이면 공분산행렬에서 표본 추출하는 것까지는 해보고 싶은데, 이게 시간 안에 이해할 수 있는 게 맞긴 한지는 모르겠다.

 

 다행인 점은 저거 공부하는 게 기말고사 시험범위라는 거? 수리통계학에 저거 관련된 내용이 나오긴 하는 것 같다. 표본 추출하는 것까지 가르치는지는 모르겠지만 말이다.

 

 이 정도까지가 시뮬레이션 구현에 대한 고민이고, 이거 말고는 그거. 설명을 어떻게 하냐. 그게 고민이다.

 

 가뜩이나 머신러닝, 이래버리면 보자마자 어렵다! 하면서 기겁할 사람들이 많을텐데. 나는 그 사람들도 이해할 수 있을만큼 내용을 풀어 써 보고 싶다.

 아주 어려운 작업이다. 사실상 이번 프로젝트에서 제일 어려운 작업이다.

 

 일단 프로젝트 전반을 이해해야 한다. 구현은 할 줄 모르더라도 원리는 제대로 이해하고 있어야 한다. 그게 안 되면 무언가를 설명한다는 것 자체가 불가능하다.

 그리고 그걸 쉽게 풀어 쓸 능력이 있어야 한다. 글만 읽더라도, 굳이 옆에서 사족을 붙이지 않더라도 이해될 수 있을만큼 말이다.

 

 솔직히 나한테 이걸 이렇게 써 주십사, 하고 부탁한다면 난 거절할 것 같다.

 난 글을 저렇게 풀어 쓸 자신이 없다. 말을 그렇게 쉽게 할 자신도 없고. 내 눈높이를 남에게 잘 맞출 수 있다는 자신도 없다.

 

 그래서 이걸 누구보다 잘 할 수 있을 것 같은 분에게 조언을 한번 구해보고 싶다. 어떻게 하면 이걸 좀 잘 해볼 수 있을지. 그런 것 말이다.

 

 이건 진짜 내 영역이 아니라. 할 말이 없긴 하다. 거의 부탁드려놓고 그분 말씀하시는대로 따라가야겠다.

 

***

 

 근데 이렇게 글 써놓고 나니까 진짜 한 분 한 분한테 등 떠미는 느낌이네….

 다들 감사합니다….