저희 프로젝트의 최종 목표는 <고객 데이터를 통해서 선호할 만한 제품 추천>하는 것입니다. 이를 위해서 저희가 중점적으로 해야 될 일은 일단 1) 고객의 특성과 행동을 잘 반영한 데이터를 생성하는 것 그 다음에 2)고객이 선호하는 제품을 잘 추천하는 모델을 만드는 것이 저희의 목표입니다.
[프로젝트 과정]
온라인 행동 데이터에는 날짜, 행동, 거래 아이디, 검색과 같이 고객이 온라인 상에서 어떤 행동을 했는지가 기록되어 있습니다. 거래 정보 데이터에는 판매처, 상품 구매 정보가 기재돼 있고 고객 정보 데이터에는 성별, 나이가 입력돼있습니다. 상품 분류 정보는 그 상품에 대한 대분류 중분류 소분류로 그룹핑돼있는데요. 저희는 중분류를 활용해서 추천 시스템에 적용시켰습니다. 기상청 데이터를 사용했는데, 홈쇼핑에서 크롤링한 데이터를 중분류 명으로 매칭하는 작업을 수행했습니다.
[결과물]
저희가 만든 모델은 고객 행동, 정보 데이터에 기반하여 카테고리를 추천하고 실제 구매한 상품과 비교하여 평가할 수도 있습니다. 그런데 추천 시스템이라는 게 기존에 다양한 방식으로 존재하고 있었잖아요. 아이펠톤에서 진행한 게 기존 시스템보다 어떤 부분이 좋다라고 뚜렷하게 말하기는 어려운 것 같아요. 라이트 bm 모델이나 엑스 딥 모델과 같이 여러 모델을 좀 더 살펴보고 비교 분석을 하려고 했습니다. 그런데 모든 모델에 데이터를 적용하고 비교 분석한 후 이게 더 우월하다라고 발표하는 데까지는 시간이 조금 부족했습니다.