ML 기반 판매량 추정 및 시장 인텔리전스
Context
출판 및 도서 유통 시장에서는 경쟁사 및 시장 전체의 실판매량 데이터를 직접 확보하기가 매우 어렵습니다. 대부분의 서점은 판매량을 직접 공개하지 않고, 자체적인 ‘판매지수’만을 제공합니다. 이러한 정보의 비대칭성 때문에 정확한 시장 점유율 파악과 수요 예측이 불가능했으며, 이는 재고 관리와 마케팅 예산 배분의 비효율로 이어졌습니다.
Action
공개된 데이터인 Yes24 판매지수를 역산하여 실제 판매량을 높은 정확도로 추정하는 기계 학습 파이프라인을 구축했습니다.
- 데이터 수집: 일일 단위로 제공되는 판매지수 및 메타 데이터를 스크래핑 파이프라인을 통해 수집했습니다.
- 상관관계 분석: 내부에서 보유하고 있는 일부 실판매량 데이터와 수집한 판매지수 간의 패턴을 분석하여 주요 피처(Feature)를 추출했습니다.
- 모델 설계: 비선형적 관계를 효과적으로 학습할 수 있는 XGBoost(eXtreme Gradient Boosting) 회귀 모델을 적용하여 판매량 역산 모델을 설계했습니다.
Impact
- 정확도 확보: 실제 판매량과 모델 예측치 간의 결정계수($R^2$) **97.8%**라는 높은 수준의 정확도를 달성했습니다.
- 데이터 기반 의사결정: 추정된 시장 전체의 판매 데이터를 바탕으로 정확한 수요 예측이 가능해졌고, 이를 통해 악성 재고 비용을 줄이고 타겟 마케팅 효율을 크게 개선했습니다.
- 시장 통찰력 획득: 블랙박스 같았던 경쟁사의 판매 추이를 가시화하여, 선제적인 비즈니스 전략 수립이 가능해졌습니다.