본문 바로가기
데이터과학자 진로정보/데이터 과학 & 통계도서

나성호의 R 데이터 분석 입문 (나성호 지음 | 골든래빗(주))

by 기서무나구물 2021. 10. 15.

포스팅 목차

    나성호의 R 데이터 분석 입문 (나성호 지음 | 골든래빗(주))

    20년 베테랑에게 아파트 실거래 데이터로 실전처럼 배워보자

    * 책소개

    ★ 명강사가 알려주는 입문자가 알아야 하는 탄탄한 R 데이터 분석 기본기

    저자는 패스트캠퍼스/러닝스픈즈/멀티캠퍼스를 비롯해 유수의 기업에서 데이터 분석 강의를 진행한 명강사입니다. 강의를 하며 1. 수강생은 바쁘다 2. 바쁘다는 이유로 자료 구조를 건너뛰고 무작정 데이터 분석부터 배우면 3. 데이터 분석을 제대로 익히지 못한다는 사실을 알아냈습니다.

    그래서 이 책을 준비했습니다. 1. 한 권으로 2. 특히 데이터 분석 핵심인 자료 구조를 자유자재로 다룰 수 있게 중점적으로 설명하고 3. 데이터 분석 전과정을 체험하게 구성했습니다. 단순히 명령어 사용법만 안다고 데이터 분석을 할 수는 없습니다. 실제 현장에서 만나게 되는 다양한 경우에 맞춰 활용하는 방법을 알아야 합니다.

    반드시 데이터 분석을 제대로 익히고 싶은 분이라면 17년간 데이터 분석가로, 3년간 강사로 활약한 저자가 제시하는 학습 방법을 따라 책에 담긴 데이터 분석 노하우도 모두 챙겨가기 바랍니다. 잊지 마세요, 자료구조가 핵심이고 먼저입니다.

    ★ Must Have 시리즈 안내
    Must Have 시리즈는 내 것으로 만드는 시간을 드립니다. 명확한 학습 목표와 핵심 정리를 제공하고, 간단명료한 설명과 다양한 그림으로 학습 효과를 극대화합니다. 예제를 제공해 응용력을 키워줍니다. 할 수 있습니다. 포기는 없습니다. 지금 당장 밑줄 긋고 메모하고 타이핑하세요! Must Have가 여러분의 성장을 돕겠습니다.


    * 출판사 서평

    ★ 데이터 분석을 잘하려면 자료구조와 프로그래밍의 기본을 잘 알아야 합니다.

    데이터 분석에 능숙하고 싶습니까? 그렇다면 자료구조를 먼저 탄탄히 익혀야 합니다. 데이터 분석 과정은 데이터를 다양한 형태로 바꾸며 진행되기 때문입니다. 그래서 이 책은 먼저 자료구조를 탄탄히 익히고 나서 R 프로그래밍, 데이터 수집, 전처리, 기술통계 분석, 시각화를 설명합니다.

    엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다. 국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보 4천 여건을 직접 수집해 활용합니다.

    17년간 데이터 분석가로서, 3년간 강사로서 활동하며 깨달은 ’고급 분석가로 가기 전에 이 정도는 알아야 하는 내용’을 충실히 담았습니다. 데이터 분석가를 꿈꾸는 대학생과 취업 준비생은 물론 데이터 분석가로 직무 전환을 바라는 직장인이 한 권으로 R 입문과 데이터 분석 전반을 체험하고 익힐 수 있도록 구성했습니다.

    [숫자로 보는 책의 특징]

    _0 아무것도 몰라도 OK
    R을 몰라도 됩니다. R 입문과 데이터 분석 입문 과정 모두를 알려줍니다.

    _3 단계로 익히는 R 데이터 분석
    1단계에서 R 자료구조, 2단계에서 프로그래밍, 3단계에서 데이터 분석(수집, 전처리, 기술 통계, 시각화)을 차례대로 배웁니다.

    _3가지 OS별 개발 환경 구축
    윈도우, 맥OS, 리눅스 개발 환경 구성 방법을 모두 제시합니다.

    _4가지 데이터 입출력 형식
    엑셀 파일, 텍스트 파일, RDS 파일, RDA 파일 입출력을 배웁니다. 이 4가지 형식으로 입출력을 자유자재로 할 줄 알면 데이터 관리가 훨씬 수월해집니다.

    _5가지 데이터 시각화 그래프 학습
    데이터의 분포와 시간에 따른 변화 및 상관관계 등 데이터 분석 과정에 유용한 5가지 시각화 그래프(히스토그램, 상자 수염 그림, 막대, 선, 산점도)를 소개합니다.

    _4000여건 아파트 매매 데이터
    국토교통부 ‘아파트 매매가격 데이터’와 한국 감정원 ‘K-APT 아파트단지’ 정보 4천 여건을 직접 수집해 활용합니다.

    [대상 독자]
    - R 데이터 분석 입문자
    - 데이터를 다루는 업무 관련 취업 희망자
    - 데이터 분석 업무에 R을 적용하고 싶은 직장인

    [저자와 4문 4답]
    R과 데이터 분석 초보자에게 전하고 싶은 말씀이 있으신가요?
    아주 당연한 얘기지만 ‘세상에 공짜는 없다’라는 말씀을 드리고 싶습니다. R과 파이썬으로 데이터 분석 강의를 판매하는 일부 기관이나 업체에서 ‘R과 파이썬 데이터 분석은 쉽다’라는 허위 광고를 수 년째 하고 있습니다. 프로그래밍도 모르고 데이터 분석도 모르는 입문자에게 자칫 불필요한 오해를 심어주고 있습니다. R과 파이썬 데이터 분석은 절대로 쉽지 않습니다. 새로운 언어를 배워야 하기 때문에 익숙해지려면 수개월에서 수년이 걸립니다. 그러다 보니 프로그래밍과 데이터 분석에 도전했다가 내 길이 아닌가 싶어서 금세 포기하는 분이 많습니다.
    프로그래밍과 데이터 분석을 꾸준하게 학습할 수 있도록 스스로 동기부여하고 환경을 조성해야 합니다. 가장 좋은 방법은 학습자 본인이 가장 좋아하는 분야를 찾고, 그 분야의 데이터를 분석해보는 겁니다. 예를 들어 야구를 좋아하는 사람은 야구 데이터를 분석하고, 영화를 좋아하는 사람은 영화 데이터를 분석하는 겁니다. 최근 주식 거래 붐이 일고 있으므로 주식 데이터를 분석하여 돈을 벌 수 있는 투자 전략을 수립하고, 자동매매 프로그래밍에 도전하는 것도 아주 좋은 동기부여가 될 것이라고 생각합니다.

    R이 얼마나 많이 사용되는 거죠?
    R은 프로그래밍 언어 랭킹에서 2020년에 8위 2021년 8월에 14위를 차지했습니다
    (tiobe.com). R은 통계학자가 통계 분석을 위해 만든 언어이므로 통계 분석에 사용합니다. 파이썬과 함께 데이터 분석 핵심 언어로 사용되고 있습니다.

    R이 데이터 분석에 많이 사용되는 이유가 있나요?
    R은 통계학자가 통계 분석을 목적으로 만든 프로그래밍 언어입니다. 그래서 통계 분석에 특화되어 있습니다. 아울러 데이터 전처리에 유용한 dplyr 패키지와 데이터 시각화에 강점을 갖는 ggplot2 패키지가 있다는 장점이 있습니다. 그리고 웹 크롤링이라든가 Shiny1를 활용해 대시보드 개발도 가능합니다.

    엑셀, R, 파이썬 데이터 분석의 장단점이 궁금합니다.
    엑셀은 사용자 친화적인 프로그램이라서 많은 직장인이 데이터 분석에 사용합니다. 그런데 엑셀은 셀마다 함수를 생성하는 방식으로 처리해야 하므로 대용량 데이터를 다루기에 한계가 있습니다. 고급 통계 분석도 사용하기 어렵습니다. 하지만 R과 파이썬으로 엑셀의 한계를 해결할 수 있습니다. 고급 통계 분석은 물론 머신러닝과 딥러닝, 텍스트 마이닝까지 수행할 수 있기 때문입니다. 다만 R과 파이썬을 잘 다루려면 키보드로 프로그래밍하는 방법에 익숙해질 필요가 있습니다.

    R과 파이썬 둘 중에 어떤 것을 배울 것인지 고르는 기준은 저마다 다르겠지만, 보통 프로그래밍 언어에 익숙한 개발자라면 파이썬이 좋고, 프로그래밍 언어가 처음인 비개발자라면 R이 좋습니다. 아무래도 인덱스가 0부터 시작하는 파이썬보다는 1부터 시작하는 R이 조금 더 인간다운 언어처럼 보이기 때문일 겁니다.


    * 출처 : http://www.kyobobook.co.kr/product/detailViewKor.laf?ejkGb=KOR&mallGb=KOR&barcode=9791191905038

     

    나성호의 R 데이터 분석 입문 - 교보문고

    20년 베테랑에게 아파트 실거래 데이터로 실전처럼 배워보자 | ★ 데이터 분석을 잘하려면 자료구조와 프로그래밍의 기본을 잘 알아야 합니다. 데이터 분석에 능숙하고 싶습니까? 그렇다면 자료

    www.kyobobook.co.kr

     

    반응형

    댓글