본문 바로가기
데이터과학자 진로정보/데이터과학자진로정보

데이터 마이너에게 필요한 스킬 (최병정 SAS코리아 부장)

by 기서무나구물 2018. 12. 2.

포스팅 목차

    데이터 마이너에게 필요한 스킬 (최병정 SAS코리아 부장)

    최고의 데이터 마이너가 되기 위해서는 어떤 기량이 필요할까? 우선, 지식 추론의 통계적 개념과 기본 원리를 이해해야 한다.


     


     
     
    추론적 통계, t-테스트, 분산 분석, 회귀 등이 중요하며, 이는 가장 기본적인 지식이다. 그런 다음에는 몇 가지 학술적 또는 상용 소프트웨어 사용법을 알고 있어야 한다. 

    학생들이라면 교육 기관의 도움을 받을 수 있다. 대기업이 사용하고 있는 소프트웨어에 액세스할 수 있다면, 소스 개방형 학술 소프트웨어를 사용하고 있는 경우보다 고용의 기회가 훨씬 넓어진다. 

    이제, 통계와 통계 소프트웨어를 알고 있다고 하자. 그것으로 전부일까?

    그렇지 않다. 현실은 대부분의 통계 수업에서 배운 방법과는 다르다. 예측 모델링 유형의 프로젝트는 예측 모델에서 시작하지 않는다.
    어떤 데이터 마이닝 프로젝트도 데이터 소프트웨어나 통계∙데이터 마이닝 소프트웨어로 시작하지 않는다. 결과적으로, ‘방법과 프로세스를 아는 것’이 아주 중요한, 또 다른 필수 요건이다. 

    비즈니스 문제에 모든 지식을 적용하라! 
    통계 방법이나, 일부 분석 소프트웨어∙방법만 알면 좋은 분석가와 데이터 마이너가 될 수 있을까? 반드시 그렇다고는 할 수 없다. 통계 기술을 사용하는 ‘애플리케이션’에 대한 지식도 필요하다.

    예를 들어, ‘신용 카드 사기 감지 모델’을 구축한다고 할 경우, 모델 구축의 기본 원리는 ‘보험 정책 위반 예측 모델’과 같다. 그러나 모델링 뉘앙스는 분명 다르다. 

    좋은 데이터 마이너는 모델링뿐만 아니라, 데이터 준비 단계에서 발생하는 모든 일이 ‘비즈니스 문제 및 목표’와 밀접한 관련이 있다는 사실을 이해해야 한다.

    앞서 예로 든 신용 카드 사기와 보험 정책 위반은 비즈니스 문제와 목표가 다른 만큼, 데이터를 준비하고 모델을 구축하는 방식에 차이가 있을 수밖에 없으며, 그 차이가 반영되어야 한다. 따라서 모델의 비즈니스 애플리케이션을 아는 것이 매우 중요하다. 

    어떤 업종에서 일하는지에 관계없이 다른 애플리케이션보다 더 자주 접하는 애플리케이션도 있다. 세분화, 판촉, 고객 이탈 방지, 고객 이탈, 고객 가치 및 수익성 등이 그렇다. 모든 실무 담당자는 적어도 이러한 측면을 잘 이해하고 있어야 한다. 이제, 이것으로 충분할까? 아직도 부족하다. 

    효과적인 방법을 파악하라! 
    최선의 방법, 즉 모범 사례를 안다면 어떨까? 특정 모델링 문제에 직면했을 때 직감과 직관력에 의존하는 대신, 나보다 앞서 같은 문제를 성공적으로 극복한 이들의 경험담은 큰 도움이 된다. 물론, ‘모범 사례 설명서’에 문제 해결 방법이 없을 경우에는 직감과 직관력에 의존하는 것도 필요하다. 

    자, 이러한 모든 지식과 스킬을 기반으로 드디어 분석 결과를 도출했다. 이로써 일이 끝난 걸까? 아니다.

    경영진 혹은 고객에게 프리젠테이션하는 일이 남아있다. 만일 당신의 분석 결과가 비즈니스 문제를 해결할 수 있다고 경영진에게 확신을 줄 수 없다면 프로젝트는 실패한 것이나 다름없다. 따라서 의사 전달 능력을 갖추어야 한다. 

    기술 언어와 비즈니스 언어는 분명, 다르다. 이 두 가지 언어 사이를 자유롭게 오갈 수 있어야 한다. 쉬운 일은 아니다. 우리 주변에는 좋은 모델러이지만 의사 전달 능력이 떨어져 모든 기회를 날려버린 모델러도 있고, 이해하기 쉽게 전달함으로써 보잘것없는 모델링 결과를 큰 성공으로 이끈 모델러도 있다. 이게 현실이다. 

    데이터 마이너로 성공하기란 쉽지 않다. 그러나 앞서 언급한 몇 가지를 충분히 숙지하고 실천한다면 당신은 훌륭한 데이터 마이너가 될 수 있다.


     
    * 출처 : http://www.bikorea.net/news/articleView.html?idxno=4828

     

    반응형

    댓글