foreverk.net
제 목 데이터마이닝(Data mining)
섬네일
내용

소중하게 모은 자료, 쓰레기가 되느냐 황금이 되느냐는 하기에 달렸다.

 

데이터마이닝(Data mining)

 

미국 할리우드 스타들의 쓰레기통을 뒤져 찾은 쓰레기로 전시회를 열어 화제가 된 적이 있다.

이름도 ‘스타 트래시’라고 붙인 이 전시회는 스타들의 사생활을 훔쳐보고 싶어 하는 심리에 착안한 것으로 상당한 인기를 모았다. 이를 위해 두 명의 프랑스 사진작가가 15년간이나 스타들의 쓰레기를 뒤졌다고 한다. 스타들의 쓰레기를 뒤지는 일은 원래 파파라치나 스토커의 몫이었다. 하지만 특정한 기획 하에 일반인들에게 전시회로 열리자 여러 가지 흥미로운 정보를 제공했다.

 

생활 속에서 쓰고 버린 쓰레기를 통해 잭 니컬슨이 프랑스산 샴페인과 멕시코 맥주를 즐겨 마시며 무슨 담배에 어떤 잡지를 찾는지, 마돈나가 물을 많이 마신다는 것과 아이들에게 어떤 맛의 시리얼을 주는지도 알게 했다. 쓰레기가 생활을 엿볼 수 있는 유용한 단서가 된 것이다.

 

쓰레기에서 유용한 단서를 찾아내는 사람들은 또 있다. 바로 수사관들이다. 피해자나 피의자의 쓰레기를 통해 수사상 중요한 그 사람의 정보를 찾아내기도 한다. 이들 모두 쓰레기(자료: Data)를 통해 뭔가 유용한 단서들을 캐내기(발굴: Mining) 위해 쓰레기통을 뒤지는 것이다. 그냥 버리면 쓰레기에 불과하지만 살펴보기에 따라 얻어낼 수 있는 정보가 있다는 말이 된다.

 

데이터마이닝도 그런 개념에서 출발한다. 60년대 초 미국의 통계학자 제임스 마이어와 에드워드 포지가 처음 만든 것으로 데이터를 다양한 분석 기법을 통해 과거에는 알지 못했던 새로운 데이터 유형을 발견하고 그 속에서 유용한 정보를 찾아내는 것을 말한다.

 

마케팅에서는 고객들의 데이터를 분석해 구매패턴과 관계, 속성 등을 파악하여 전략수립, 변화 예측, 고객세분화, 판매촉진, 사고와 이탈 방지, 효율적인 관리 등 다양한 목적으로 성과를 얻기 위해 적용하는 기법이다.

 

데이터마이닝은 넓은 의미로 데이터를 활용한 마케팅 기법이라는 면에서 데이터베이스마케팅의 범주에 속하지만, 다소 구분해서 이해할 필요가 있다. 데이터마이닝은 데이터에 나타난 표면적인 유형과 특성을 기반으로 하기보다 데이터에 숨겨진 패턴과 관계를 찾아내어 광맥을 찾아내듯이 새로운 정보를 발견해 내는 점이 중요하다. 그래서 마이닝(Mining)이다.

 

가령 우리가 흔하게 받는 포털사이트의 광고메일은 사전에 사용자가 등록한 성별과 연령, 직업, 학력, 관심분야 등 1차 자료 통계의 필터링을 통해 고객에게 맞춤형으로 보내는 것이 대부분이다. 때 되면 자동차 보험 갱신하라고 오는 전화나, 그걸 뺏어가려고 보내오는 타 회사의 DM도 단순한 수준의 데이터베이스마케팅이다.

 

그러나 데이터마이닝은 좀 더 구체적이고 파생적인 선택과 영향까지 포함하는 개념이다. 우리가 할인점에서 쇼핑을 하고 받는 영수증은 우리가 무엇을 샀는지 확인하게 하는 증명서지만, 업체입장에선 고객들의 구매패턴과 특성을 알게 하고 속성까지 짐작케 소중한 데이터다. 콘칩을 구매하는 소비자의 50%가 콜라도 함께 구입한다는 연관성이나, 고급 테니스 라켓을 구입한 후, 머지않은 장래에 골프채를 구입할 확률이 높다는 연속성을 알아냄으로써 효과적인 상품의 배치와 판촉시기를 정하게 한다.

 

대표적인 예로 미국의 대형쇼핑몰 월마트와 아마존과 같은 인터넷 서점이 있다. 월마트의 경우 고객들의 매출 내역이라는 엄청난 양의 데이터(Data)에서 ‘기저귀와 맥주의 관계’라는 귀중한 정보를 캐내는데(Mining) 데이터마이닝을 활용했다. 유아용 기저귀와 함께 가장 잘 팔리는 제품이 흔히 유아용품이나 위생용품일 것으로 생각하겠지만 의외로 맥주라는 연관성을 찾은 것이다. 조사한 결과에 따르면, 아내의 부탁으로 기저귀를 사러 온 남편들이 집에 가서 편안히 쉬면서 마시기 위해 맥주를 함께 구입하기 때문인 것으로 나타난 것이다. 실제로 기저귀와 맥주를 매장에 나란히 배치했더니 맥주 매출을 크게 올릴 수 있었다는 것이다.

 

또 하나 지금은 국내 인터넷 서점도 많이 적용하고 있지만 아마존에서 처음으로 실시한 고객들의 성향과 선택한 상품의 집단 특성 활용 방법이다. 어떤 책을 선택했을 때, 특정 책을 구입한 사람이 어떤 책을 구입했는지, 어떤 책에 관심을 보였는지 수많은 연결고리들을 제공하면서 파생되는 매출을 유도하는 방법이다. 이런 방법과 결과들이 모두 일정기간 동안 수집되고 축적된 고객들의 데이터를 바탕으로 데이터마이닝을 해서 얻은 것들이다.

 

아직 국내에서는 통신이나 금융, 유통업계 등에서 적용을 하고 있지만, 1차적 데이터 활용이나 공유 정도의 미약한 수준이다. 하지만 적용수준과 활용여하에 따라 향후에는 불특정 다수를 향한 매스마케팅이나 일회성 행사의 불합리성을 개선하는 효과적인 방법이 될 전망이다.

 

마케팅에 관련된 여건이나 에너지가 상대적으로 열악한 작은 기업의 경우 타 업체와의 데이터베이스 공유를 통한 공동마케팅이나, 비록 소규모의 자체 데이터라 하더라도 세밀화와 확장 노력을 통해 마케팅에 유용한 데이터마이닝을 해낼 수 있다. 관건은 데이터의 양보다 데이터의 신뢰도와 다양한 분석기법이기 때문에 데이터 세밀화와 확장 단계에서부터 염두에 두고 실시한다면 합리적인 비용으로 성과를 얻을 수 있다.

출처
참고URL -
작성일 2010-07-06 08:47 조회수 540
목록