포스팅 목차
통계프로그램 비교 시리즈 – 14. 변수 특성에 따른 통계량 일괄 처리 & Value Labels Or Formats(& Measurement Level))
(Proc Sql, SAS, SPSS, R, R-Tidyverse, Pandas, Python dfply)
1. PROC SQL :
- 데이터 라벨링 : PROC FORMAT
2. SAS :
- 데이터 라벨링 : PROC FORMAT
3. SPSS :
- 데이터 라벨링 : VALUE LABELS
4. R 프로그래밍 :
- 데이터 라벨링 : factor
- 통계량 일괄 처리 : base::summary / Hmisc::describe / describeData /
dlookr::diagnose_numeric / purrr::keep ~ dlookr::describe()
5. R - Tidyverse :
- 데이터 라벨링 : factor
- 통계량 일괄 처리 : dlookr::diagnose_numeric / dlookr::describe / purrr::keep ~ dlookr::describe()
purrr::keep ~ purrr::map_df ~ psych::describe / mutate_at ~ select ~ 사용자함수
6. Python - Pandas :
- 데이터 라벨링 : astype('category')
- 통계량 일괄 처리 : describe() / apply(lambda x : x.describe()) / map(labels2) / value_counts()
7. Python - dfply :
- 데이터 라벨링 : apply(lambda x: labels2.get(x)) / map(labels2) / astype('category')
- 통계량 일괄 처리 : describe() / summarize ~ select_dtypes(int).columns / 사용자함수
* 출처 : statwith.com/통계프로그램-비교-시리즈-14-변수-특성에-따른-통계/
* 자기주도온라인무료학습센터 : withmooc.com/courses/
* 통계분석연구회 : cafe.daum.net/statsas
댓글