본문 바로가기
데이터과학자 진로정보

데이터 분석가 SAS KOREA 송미혜 이사 인터뷰

by 기서무나구물 2018. 11. 4.

포스팅 목차


    데이터마이너로서 일한 지는 약 12년 정도 되었습니다. 미국에서 데이터마이닝을 접근하는 여러 분야 중 하나인 Mathematical Programming 분야를 공부하고 있었는데 그 즈음 한국에서는 데이터웨어하우스와 함께 데이터마이닝에 대한 개념과 적용 타당성을 검토할 초기단계이었었습니다. 때마침 한국의 한 기업 연구소에서 Data Mining 분야를 만들었는데 참여하는 것이 어떻겠냐는 제안이 있어 한국에 돌아와 그 연구소에서 데이터마이닝에 대한 알고리즘 연구를 하게 되면서 본격적으로 데이터마이너로서의 일을 시작하게 되었습니다.


    데이터마이너들은 보통 기업 내에서 마케팅이나 고객관리 업무를 맡으며 동시에 데이터분석가로 활동하기도 하고, 금융권, 정부 산하기관, 의료기관 등의 프로젝트에 참여하기 때문에 해당 기관에서 파견 근무하는 경우도 많습니다.

    데이터마이너로서 일하게 되는 경우는 주로 고객 사에서 프로젝트를 수행하게 될 때입니다. 이 경우는 아침에 출근하여 프로젝트 일정에 근거하여 데이터마이닝의 핵심적인 6 단계 중의 해당일의 작업을 수행합니다. 데이터마이닝의 핵심적인 6 단계를 시간적 흐름에 따라 말씀 드리면 다음과 같습니다.

    1. 고객 요구사항 파악 : 고객이 가지고 있는 어떤 이슈를 해결하고자 하는지 또는 어떤 기회를 획득하고자 하는지를 파악하는 단계입니다.
    2. 분석 방향 설계 : 파악된 고객 요구사항이 데이터마이닝적인 접근방식으로 해결가능한지 판단하고 가능하다고 판단 시 어떤 방식으로 해결 할 수 있을지 고객의 비즈니스적 요구사항을 데이터마이닝적인 문제로 전환하는 단계입니다.
    3. 데이터 준비 : 전환된 데이터마이닝적 문제를 해결하기 위해 필요한 데이터를 정의하고 해당 데이터의 존재/가용여부를 확인 후 이를 데이터 원천으로부터 획득하여 분석에 적합한 형태로 변환, 정제하거나 분석에 필요한 데이터를 보완하여 분석을 위한 데이터를 생성하는 단계입니다.
    4. 분석 : 데이터마이닝 기법을 적용하여 데이터마이닝적인 문제에 대한 솔루션을 찾는 단계입니다. 이 단계에서 보통 이야기하는 탐색적 또는 예측적 모델들이 생성됩니다.
    5. 결과 평가 : 분석 결과를 분석적 또는 업무적인 측면으로 분석하여 도출한 결과의 유용성 및 효과성을 평가하는 단계입니다. 이 평가 결과에 따라 평가시 논의되었던 의견을 반영하여 이전 단계를 보완/수정하여 재 수행하는 경우도 있습니다.

    결과 적용 : 평가를 거쳐 그 유용성과 효과성이 검증된 경우 실제 업무에 적용하는 단계입니다.

    데이터마이너들만의 모임은 오프라인 상에서는 90년대 후반에 SIG 형태로 시작되어 이제는 학회의 수준으로 성장한 데이터마이닝 관련 단체들이 있으며 온라인 상에서는 유명 포털사이트에 개설되어 운영되고 있는 데이터마이닝 관련 카페나 동호회가 많습니다. 이러한 단체에서는 정기적, 비정기적인 모임을 가지고 있으면 모임을 통해 서로의 경험과 지식을 공유하고 있습니다.

    데이터마이너가 되기 위한 전공이 특별히 한정돼 있지는 않지만, 데이터마이너로 활동 중인 전문가의 70~80%가 통계학과를 전공하신 분들입니다. 그 외에는 산업공학, 경제학, 수학, 경영학, 재무 및 경제학을 공부하신 분들이 많은 편 입니다.
    데이터마이너들은 기본적으로 숫자와 데이터를 다루는 능력이 중요합니다. 하지만 더욱 필요한 자질은 다양한 비즈니스 분야의 특성과 문제점들을 파악하고 개량적으로 전환하는 능력이 필요합니다. 즉, 기업 경영, 경제, 기업구조, 금융시스템 및 산업전반에 대한 폭넓은 지식과 안목이 필요하고 더 중요하다고 할 수 있습니다. 그 이유는 어떤 기업에 해결해야 할 문제가 있을 때, 데이너마이닝을 이용한 데이터 분석으로 그 문제를 해결할 수 있는지 가치 판단을 할 수 있어야 성공적인 데이터마이닝이 가능하기 때문입니다.

    또한, SAS(쌔쓰)코리아 처럼 업체 프로젝트를 맡아 진행하는 경우, 매 번 새로운 장소에서 낯선 사람들을 만나야 하므로 다변화 환경에서의 친화력, 적응력도 필요합니다.

    급여수준은 일반 대기업 정도의 고정급여와 파견근무에 따른 인센티브가 추가되는 시스템입니다. 전문직 고 기업 내부에서 교육시키고 키워내기가 어렵기 때문에 대체적으로 고소득을 보장받고 있는 편입니다

    데이터마이너로서 가장 기억에 남는 일은 한 프로젝트에서 하나의 과제를 해결하기 위해 한 데이터마이너가 고객 요구사항을 바탕으로 고객이 보유하고 있는 데이터 범위 내에서 산출한 분석결과를 고객이 만족해 하지 않는(더 향상된 정확도에 대한 요구) 어려운 상황이 있었습니다. 그때 여러 다양한 방법을 적용해 보았는데도 그 결과가 개선이 되지 않다가 여러 명의 데이터마이너들이 함께 여러 날 고민 끝에 새로운 방법을 고안해 냈고 그 방법을 적용해서 그 결과가 개선되었을 때 그래서 고객을 만족시켰을 때 정말 뿌듯했었던 경험이 있습니다. 데이터마이너로서 일하다 보면 보통 처음부터 결과가 만족스러워서 고객을 만족시키기가 용이했던 경우보다 고민과 고생 끝에 해결 방법을 찾았을 때의 경우가 

    더 기억에 남습니다.

    데이터마이너에게 있어서는 현상을 넓게 바라보는 통찰력과 그 현상 속에서 문제점을 집어내고 해결방안을 도출할 수 있는 분석력이 필수적입니다. 평소에 비즈니스 트렌드나 산업 트렌드를 짚어보며 관심 분야에 대한 다방면의 지식을 쌓아둔다면 데이터마이너의 기본적인 자질을 쌓을 수 있다고 생각합니다. 관심 산업의 특징적 상황이나 트렌드를 신문이나 뉴스, 경제 및 산업전문지 등에서 스크랩해 보는 것도 좋은 경험이 될 것입니다. 혹은 SAS에서 주관하는 ‘SAS 마이닝챔피언십’ 과 같은 공모전에 응모하면서 실 데이터를 다뤄보는 연습이 많이 도움이 될 것입니다. 이번 해 SAS의 인턴으로 뽑힌 친구들이 바로 이 공모전에서 수상한 친구들입니다. 현재 일부는 고객 프로젝트에 파견 나가있습니다.

    데이터마이닝과 관련된 자격증으로는 SAS(쌔쓰)코리아에서 주관하는 ‘SAS 국제 공인 인증시험’이 있으며 데이터마이너로서의 능력을 평가하는 하나의 중요한 기준으로 통용되고 있습니다. 하지만 무엇보다도 중요한 것은 자신의 관심 분야의 산업 동향을 지속적으로 살피고 관심을 가지는 자세라고 생각합니다. 또한 이러한 동향을 살피며 각 산업 분야에 리스크나 문제들을 보고 데이터 분석으로 어떻게 해결할 수 있을지에 대해 개량적으로 접근해 보려고 하는 습관을 갖는 것이 중요합니다.

    SAS코리아에는 교육팀이 별도로 있기 때문에 후배들을 직접 교육을 하지는 않지만 프로젝트를 수행하는 후배들에게 선배로서 데이터마이너로서 경험했던 내용들을 공유하면서 간접 교육을 합니다. 그리고 정기적으로는 현재 기업인들 대상으로 교육하는 기관을 통해 고객분석 등의 교육명으로 데이터마이닝에 대한 교육을 담당하고 있습니다.

    ‘정보의 홍수 시대’에 특히나 변수가 많고 예측이 어려운 현대 비즈니스 환경에서는 정확한 분석을 통해 가치 있는 정보를 골라 의사결정에 활용하는 것이 기업의 성패를 좌우하고 있으며, 요즘 같은 경기침체와 금융위기를 겪고 있는 기업 환경에서는 데이터마이닝의 중요성이 더욱 커졌습니다.
    한국의 경우에는 데이터마이닝이 아직은 초기 단계에 있지만 빠른 시일 내에 일반화 될 것으로 예상합니다. 현재 최적의 데이터웨어하우스를 구축하고 있는 많은 한국 기업들이 있기 때문에 데이터마이너의 역할은 더욱 커질 것으로 기대합니다. 또한 많은 기업들이 고객관리에 중점을 두는 데이터베이스 마케팅에 주력하는 방향으로 가고 있어 데이터마이닝 분야의 발달이 급속히 진행될 수 있는 가능성도 높다고 전망하고 있습니다. 그리고 데이터마이닝을 적용할 수 있는 분야도 카드사, 백화점부터 반도체, 제약, 의료, 제철, 생명공학 등에 이르기까지 다양하여 그 발전 가능성은 충분하다고 생각합니다.

    우선, 데이터마이너(data miner)는 정보를 뜻하는 ‘데이터(data)’와 광석을 캐는 광부 ‘마이너(miner)’가 결합된 단어로 정보를 캐내는 사람을 지칭합니다. 즉, 방대한 양의 데이터와 정보에 의미를 부여하고, 그 의미를 분석하는 직업을 가리킵니다.

    현재 국내 몇 명의 데이터마이너가 활동하고 있는지는 조사된 적이 없는 것으로 알고 있기 때문에 정확히 말씀 드리기는 어려울 것 같습니다. 다만, 대부분의 대기업에서는 CRM, Risk, 신용평가, 품질관련 등의 부서에 수명의 데이터마이너들이 있으며 데이터마이닝 관련 서비스를 수행하는 입장에서도 크고 작은 기업들이 있고 그 기업들이 데이터마이너들 적게는 수명에서 수 십명 까지 보유하고 있는것으로 알고있습니다.

    데이터마이너로서 앞으로의 두 가지 꿈이 있습니다.

    첫 번째 꿈은 데이터마이닝 적용 영역을 확대하는 것입니다. 지금까지 데이터마이닝이 주로 적용되고 있는 금융, 통신, 유통, 제조 산업 이외의 새로운 산업이나 기존 산업 경우는 그 적용분야를 확대해서 데이터마이닝의 유용성을 알리고 실현하고자 합니다.

    두 번째 꿈은 후배 데이터마이너를 양성하는 것 입니다. 사실 국내에 데이터마이닝이 처음 소개되어 상용화가 본격화된 것은 90년대 중 후반인데 그 시기에는 데이터마이닝에 대해 함께 이야기를 나눌 수 있는 사람들이 그리 많지 않아 데이터마이너가 되고자 하는 사람들이 데이터마이닝을 체계적으로 배울 기회가 거의 없었습니다. 지금은 그 동안 데이터마이닝 적용을 통해 데이터마이닝에 대한 가능성과 한계성에 관한 많은 사례 및 연구들이 나와 있기 때문에 이를 바탕으로 교육 프로그램이나 지도를 통해 데이터 마이너가 되고자 하는 후배들을 양성하고자 합니다.



    Development Category (English)300x250


    반응형

    댓글