투자칼럼

투자 시뮬레이션의 함정: 생존 편향과 데이터 오류

ai generated 8120277 1280

투자의 본질을 되새기는 그린블라트의 가치 투자 연구

조엘 그린블라트의 연구는 소액 투자자들에게 중요한 교훈을 제공합니다.
그의 연구는 특히 마법 공식(Magic Formula, MF)을 이용한 투자 방법론을 통해, 복잡한 투자 전략보다 단순하고 체계적인 접근이 얼마나 효과적일 수 있는지를 보여줍니다.
그러나 많은 투자자들이 이러한 단순함을 외면하고, 복잡성을 추구함으로써 스스로의 수익률을 저해하는 경향이 있음을 발견했습니다.


투자자들의 선택과 그 결과

  • 소액 투자자들의 성과: 그린블라트의 연구에 따르면, MF를 이용해 선별된 주식 목록에서 직접 종목을 선택해 운용한 소액 투자자들의 수익률은 S&P 500 지수의 62.7%에 불과한 59.4%를 기록했습니다.
    이는 시장 평균에도 못 미치는 결과로, 투자자들이 시장을 능가할 수 있는 모형을 사용했음에도 불구하고, 스스로 초과 수익률을 상쇄시켰음을 의미합니다[3].
  • 펀드 매니저의 성과: 반면, 동일한 MF를 기반으로 운용된 펀드 매니저의 계정은 84.1%의 수익률을 기록, 직접 운용한 계정을 약 25%p, S&P 500을 20%p 능가하는 뛰어난 성과를 보였습니다.
    이를 통해 체계적이고 전문적인 운용이 얼마나 중요한지를 잘 보여줍니다.

투자의 본질과 그린블라트의 교훈

  • 투자자들의 실수: 많은 투자자들이 최고의 수익종목을 매수하지 않음으로써, 모형이 제공하는 모든 시장 초과 요인을 스스로 무력화시켰습니다.
    단순히 무작위 선택의 오류가 아니라, 체계적으로 최고의 수익주를 외면한 결과입니다.
    투자자들은 종종 복잡성을 선호하며, 주식봥송과 유튜브 주식채널 같은 방송 출연자들이 제시하는 복잡한 이유를 더 신뢰하는 경향이 있습니다.
  • 전문가의 한계: 심지어 전문가들조차도 간단한 모형의 판단을 능가하지 못하는 경우가 많습니다.
    연구에 따르면, 전문가들이 모형의 결과를 참고하더라도, 그들의 전문성이 오히려 모형의 정확성에서 멀어지는 경향이 있습니다.
    전문가들도 행동 편향에서 자유롭지 못한 사람이기 때문입니다.

그린블라트의 연구는 투자의 본질에 대해 다시 한번 생각해 볼 기회를 제공합니다.
복잡한 전략과 전문가의 의견에 휘둘리기보다는, 검증된 모형과 체계적인 접근 방식이 장기적으로 더 나은 성과를 가져올 수 있음을 상기시켜 줍니다.
투자의 세계에서 단순함이 갖는 힘을 잊지 말아야 할 것입니다.

놓치지 말아야할 실수: 투자 시뮬레이션의 오류와 그 해결책

투자 시뮬레이션은 투자자들에게 미래의 수익률을 예측하는 중요한 도구입니다. 하지만, 이 과정에서 발생할 수 있는 다양한 오류들이 있으며, 이를 인식하고 대처하는 것이 중요합니다.
특히, 생존 편향과 데이터의 정확성 문제는 투자 시뮬레이션의 신뢰도를 크게 떨어뜨릴 수 있습니다.
투자 시뮬레이션의 주요 오류들과 이를 해결하기 위한 방안들에 대해 알아보겠습니다.


생존 편향의 문제와 해결책

  • 생존 편향: 투자 시뮬레이션에서 상장폐지된 종목을 제외함으로써 발생하는 오류입니다.
    이로 인해 실제보다 높은 수익률을 예측할 위험이 있습니다.
  • 해결책: CRSP 데이터베이스와 같이 상장폐지된 종목도 포함하는 데이터베이스를 사용합니다.
    이를 통해 보다 정확한 투자 시뮬레이션 결과를 얻을 수 있습니다.

데이터의 정확성과 무결성

  • 데이터 무결성: 투자 시뮬레이션의 정확성을 보장하기 위해, 데이터의 무결성을 확보하는 것이 중요합니다.
    상장폐지된 종목의 데이터를 정확히 반영하는 것이 포함됩니다.
  • 데이터베이스 선택: 신뢰할 수 있는 데이터베이스의 선택은 투자 시뮬레이션의 정확성을 크게 향상시킵니다.
    CRSP 데이터베이스는 ‘사라진(?)’ 기업과 상장폐지된 기업도 포함하여 높은 신뢰도를 제공합니다.

CRSP 데이터베이스

CRSP(Chicago Research in Security Prices) 데이터베이스는 경제 예측, 주식 시장 연구, 그리고 학계, 상업, 정부 기관의 금융 분석을 위한 고품질 데이터를 제공합니다.
이 데이터베이스는 독특한 연구 자원으로, 비교할 수 없는 폭넓은 범위와 깊이를 자랑하며, 일일 및 월간 시장 및 기업 행동 데이터를 제공합니다.


CRSP 데이터베이스의 주요 특징

  • 데이터 제공 범위: CRSP는 다음과 같은 다양한 연구 데이터 제품을 제공합니다.
    • CRSP 미국 주식 데이터베이스
    • CRSP 역사적 지수
    • CRSP/Compustat 통합 데이터베이스
    • CRSP 생존 편향 없는 미국 상호 기금
    • CRSP 미국 국채 데이터베이스
    • CRSP/Ziman 부동산 데이터 시리즈
    • CRSP10
    • CRSP Cap-Based 포트폴리오 지수
    • CRSPMI Intraday
    • CRSPMI 2013 Hist [1]
  • 데이터베이스 내용: CRSP 미국 주식 데이터베이스는 상장된 NYSE, Amex, NASDAQ 공통 주식의 종일 및 월말 가격, 기본 시장 지수를 포함합니다.

투자 시뮬레이션은 투자 결정 과정에서 중요한 역할을 합니다.
하지만, 생존 편향과 같은 오류를 방지하고, 데이터의 정확성과 무결성을 확보하는 것이 중요합니다.
신뢰할 수 있는 데이터베이스를 사용하고, 상장폐지된 종목의 데이터를 정확히 반영해야, 보다 정확한 투자 시뮬레이션 결과를 얻을 수 있습니다.

국내주식 시장의 경우도 마찬가지입니다. 맣은 이들이 요즘 넘쳐나는 서비스들로 백테스팅을 거치며 높은 수익률에 도취되어 실전으로 바로 넘어가서 낭패를 보는 경우를 많이 목격합니다.
필자도 몇몇 서비스를 테스트해 본 결과 초창기 모델의 경우 데이터의 결점을 많이 발견할 수 있었습니다.
현재는 많이 나아지긴 했지만 그래도 사용자분들이 다시 한번 확인해보는 것이 좋습니다.
내가 추출한 개별 종목의 성과나 생존여부는 기본적으로 체크해야 합니다. 또한 아래와 같은 많은 시용자에게 검증된 데이터를 사용하는 것이 좋습니다.

  • KRX 한국거래소 정보데이터시스템: 증권·파생상품의 시장정보, 공매도정보, 투자분석정보 등을 포함하여 한국거래소의 정보데이터를 통합하여 제공하는 서비스입니다.
  • FinanceDataReader: 경제지표, 가격 데이터 등을 포함한 전세계 및 국내주식의 주가 데이터를 제공하는 오픈 소스 라이브러리입니다.
  • pykrx: KRX 데이터센터의 거의 대부분 정보를 읽어올 수 있는 파이썬 라이브러리로, 주가 정보를 스크래핑하여 잘 정제된 API 형태로 제공합니다.
  • KOSIS 국가통계포털: 한국의 각종 통계, 경제지표 등을 제공하는 서비스로, 물가, 통화량, 주택착공량 등의 데이터를 엑셀로 다운로드할 수 있습니다.

또한 실전으로 들어가기전 소액으로라도 꼭 실적용 후 자금을 배분하시기 바랍니다.
매매비용과 백테스팅에서 발견하지 못한 리스크를 최대한 검증하셔야 전략의 효용성을 믿고 마음편한 투자를 이어나가실수 있습니다.

!! 보고서의 내용은 투자판단의 참고사항이며, 본 내용에 의한 투자결과에 대해 바투가와 작성 필진은 법적 책임을 지지 않습니다.

Leave a comment

답글 남기기

Related Articles

가치
투자칼럼

GPA 지표로 측정하는 기업의 진정한 경제적 수익성과 QV 체크리스트

퀀트와 가치 투자의 결합: 새로운 전략의 탐색 투자의 세계는 끊임없이 변화하고 발전합니다....

success 2081168 1280
투자칼럼

조엘 그린블라트의 마법공식에서 우량 기업을 싸게 사는 비법

조엘 그린블라트? 조엘 그린블라트는 ‘주식시장을 이기는 작은 책’으로 많은 이들에게 알려진 투자...

laughter in the sun scaled 1400x934 1
투자칼럼

데이터 마이닝과 퀀트 투자의 황홀한 콜라보

데이터 마이닝의 함정과 퀀트투자의 도전 통계와 데이터 분석은 현대 금융 투자의 핵심...

팩터 분석의 비밀: 주식 시장 초과 수익을 창출하는 전략
투자칼럼

데이터 분석의 미로: 주가, 거래량, 그리고 지속 가능한 알파 찾기

주가와 거래량, 그리고 데이터 분석 주가와 거래량의 움직임은 투자자들에게 매우 중요한 정보...