본문 바로가기
파이썬 게시판

통계프로그램 비교 시리즈 – 14. 변수 특성에 따른 통계량 일괄 처리 & Value Labels Or Formats(& Measurement Level))

by 기서무나구물 2020. 10. 20.

포스팅 목차

    통계프로그램 비교 시리즈 – 14. 변수 특성에 따른 통계량 일괄 처리 & Value Labels Or Formats(& Measurement Level))

    (Proc Sql, SAS, SPSS, R, R-Tidyverse, Pandas, Python dfply)

    1. PROC SQL : 
       - 데이터 라벨링 : PROC FORMAT

    2. SAS 
       - 데이터 라벨링 : PROC FORMAT

    3. SPSS : 
       - 데이터 라벨링 : VALUE LABELS

    4. R 프로그래밍 : 
       - 데이터 라벨링 : factor
       - 통계량 일괄 처리 : base::summary / Hmisc::describe / describeData / 
                                 dlookr::diagnose_numeric / purrr::keep ~ dlookr::describe()

    5. R - Tidyverse : 
       - 데이터 라벨링 : factor
       - 통계량 일괄 처리 : dlookr::diagnose_numeric / dlookr::describe / purrr::keep ~ dlookr::describe()
                                 purrr::keep ~ purrr::map_df ~ psych::describe / mutate_at ~ select ~ 사용자함수


    6. Python - Pandas : 
       - 데이터 라벨링 : astype('category')
       - 통계량 일괄 처리 : describe() / apply(lambda x : x.describe()) / map(labels2) / value_counts()

    7. Python - dfply : 
       - 데이터 라벨링 : apply(lambda x: labels2.get(x)) / map(labels2) / astype('category')
       - 통계량 일괄 처리 : describe() / summarize ~ select_dtypes(int).columns / 사용자함수

    * 출처 : statwith.com/통계프로그램-비교-시리즈-14-변수-특성에-따른-통계/

    * 자기주도온라인무료학습센터 : withmooc.com/courses/

    * 통계분석연구회 : cafe.daum.net/statsas

    반응형

    댓글