본문 바로가기
반응형

통계프로그램 비교 시리즈659

[문자 함수] 문자 길이 측정 - 87 87. Display those employees whose name contains not less than 5 chars * 사원 이름이 5글자 이상인 직원을 선택하시오. 파이썬 & R 패키지 호출 및 예제 데이터 생성 링크 [문자 함수] 문자 길이 측정 Oracle : length() 파이썬 Pandas : str.match(), str.len(), loc[], str.len() R 프로그래밍 : grep(), subset(), grepl(), stringr::str_detect(), stringr::str_length(), nchar(), as.character() R Dplyr Package : dplyr::filter(), stringr::str_length(), grepl(), stringr.. 2022. 9. 26.
[데이터 전처리] 비상관 서브쿼리(Uncorrelated Subqueyr) 를 만족하는 데이터 추출 - 상하 결합 UNION 연산자 - 86 86. Display those who are not managers and who are managers any one. * 관리자 이 외의 직원과 관리자 직무를 수행하는 직원을 출력하시오. 파이썬 & R 패키지 호출 및 예제 데이터 생성 링크 [데이터 추출] 비상관 서브쿼리(Uncorrelated Subqueyr) 를 만족하는 데이터 추출 - 상하 결합 UNION 연산자 Oracle : in 연산자, not in 연산자, union 파이썬 Pandas : pd.concat(), isin(), NOT('~') 연산자, notnull(), drop_duplicates(), reset_index() R 프로그래밍 : unique(), rbind(), NOT('!') 연산자, %in%, unlist() R .. 2022. 9. 23.
[데이터 전처리 비교- 데이터 추출] 비상관 서브쿼리를 만족하는 데이터 추출 & 부등호 연산 - 85 85. Display the details of employees who are in sales dept and grade is 3. * 영업부서(Salses - ‘30’)에 근무하는 직원 중에서 판매 급여 등급이 3등급인 직원의 정보를 출력하시오. 파이썬 & R 패키지 호출 및 예제 데이터 생성 링크 [테이블 결합] LEFT JOIN (왼쪽 결합) 으로 2개 테이블 결합 - 왼쪽 테이블을 기준으로 오른쪽 테이블에 존재하지 않는 데이터 추출 Oracle : 비상관 서브쿼리(Uncorrelated Subqueyr), 부등호연산 파이썬 Pandas : tolist(), 부등호 연산 R 프로그래밍 : R Dplyr : R sqldf : 비상관 서브쿼리(Uncorrelated Subqueyr), Not in P.. 2022. 6. 13.
통계프로그램 전처리 비교 (Proc sql, SAS, SPSS, R 프로그래밍, R Tidyverse, Python Pandas, Python Dfply) 통계프로그램 전처리 비교 (Proc sql, SAS, SPSS, R 프로그래밍, R Tidyverse, Python Pandas, Python Dfply) - 데이터 획득 1. 예제 텍스트 파일 2. DATA EDITOR 3. 쉼표(,) 구분자 텍스트 파일 읽기 4. 프로그램 내에서 TEXT 데이터 읽기 5. 고정 길이 텍스트 파일 읽기 (한줄에 하나의 관측치) 6. 고정 길이 텍스트 파일 읽기 (두개의 행에 하나의 관측치존재) 7. IMPORTING DATA FROM SAS 8. IMPORTING DATA FROM SPSS 9. EXPORTING DATA TO SAS & SPSS DATA SETS - 변수와 관측치 선택 1. 변수 선택하기 2. 관측치 선택( WHERE, IF, SELECT IF ) 3.. 2022. 1. 19.
15. 변수 라벨(Variable Labels) 통계프로그램 비교 시리즈 – 15. 변수 라벨(Variable Labels) 1. Proc SQL SAS Programming proc sql; select id, workshop , gender , q1 label='The instructor was well prepared.', q2 label='The instructor communicated well.', q3 label='The course materials were helpful.', q4 label='Overall, I found this workshop useful.' from BACK.mydata; quit; Results The Overall, The The course I found instructor instructor materia.. 2022. 1. 19.
14. 변수 특성에 따른 통계량 일괄 처리 & Value Labels Or Formats(& Measurement Level)) 14. 변수 특성에 따른 통계량 일괄 처리 & Value Labels Or Formats(& Measurement Level)) 1. Proc SQL SAS Program to Assign Value Labels (formats) SAS Programming options linesize=150; * SAS Program to Assign Value Labels (formats); PROC FORMAT; VALUE workshop_f 1="Control" 2="Treatment"; VALUE $gender_f "m"="Male" "f"="Female"; VALUE agreement 1='Strongly Disagree' 2='Disagree' 3='Neutral' 4='Agree' 5='Strongly .. 2022. 1. 17.
통계프로그램 비교 시리즈 - 13. 데이터 프레임 정렬과 중복제거-Sorting & duplicate 13. 데이터 프레임 정렬과 중복제거-Sorting & duplicate 1. Proc SQL Order by 구분을 이용하여 데이터 소트; SAS Programming proc sql; select * from BACK.mydata order by workshop; quit; Results id workshop gender q1 q2 q3 q4 -------------------------------------------------------------- 3 1 f 2 2 4 3 5 1 m 4 5 2 4 7 1 m 5 3 4 4 1 1 f 1 1 5 1 6 2 m 5 4 5 5 2 2 f 2 1 4 1 4 2 f 3 1 . 3 8 2 m 4 5 5 5 SAS Programming proc sql; se.. 2022. 1. 15.
[데이터 관리] 12. 변수를 관측치로 전치후 원상태로 복구 [데이터 관리] 12. 변수를 관측치로 전치후 원상태로 복구 * Reshaping Variables to Observations and Back 1. Proc SQL 2. SAS Programming 데이터 전치를 위한 SAS 프로그램. 길이가 넓은 포맷을 긴 포맷으로 전치.; SAS Programming data BACK.mydata; infile 'c:\data\mydata.csv' delimiter = ',' MISSOVER DSD lrecl=32767 firstobs=2 ; input id workshop gender $ q1 q2 q3 q4; run; 배열을 이용한 데이터 전치; SAS Programming DATA mylong; SET BACK.mydata; ARRAY q{4} q1-q4; D.. 2022. 1. 15.
[데이터 관리] 11. Aggregating Or Summarizing 데이터 [데이터 관리] 11. Aggregating Or Summarizing 데이터 1. Proc SQL SAS Programming proc sql; create table withmooc as select GENDER, MEAN(q1) as q1_mean from BACK.mydata group by GENDER; select * from withmooc; quit; Results gender q1_mean ------------------ f 2 m 4.5 SAS Programming proc sql; create table withmooc as select WORKSHOP, GENDER, MEAN(q1) as q1_mean from BACK.mydata group by 1,2; select * from.. 2022. 1. 15.
[데이터 관리] 10. Joining & Merging 데이터 프레임 [데이터 관리] 10. Joining & Merging 데이터 프레임 1. Proc SQL 중복 시 SAS의 MERGE와 차이 발생 SAS Programming proc sql; create table myleft as select id,workshop,gender,q1,q2 from BACK.mydata; create table myright as select id,workshop,q3,q4 from BACK.mydata; create table myshort(where=(NUM 2022. 1. 14.
[데이터 관리] 9. Stacking & Concatenating & Adding Data Sets [데이터 관리] 9. Stacking & Concatenating & Adding Data Sets (Union / 상하 결합) 1. Proc SQL Stacking(Unoin) 작업을 위하여 실습 데이터 생성 SAS Programming proc sql; create table males as select * from BACK.mydata where gender='m'; select * from males; quit; Results id workshop gender q1 q2 q3 q4 -------------------------------------------------------------- 5 1 m 4 5 2 4 6 2 m 5 4 5 5 7 1 m 5 3 4 4 8 2 m 4 5 5 5 Sta.. 2022. 1. 14.
[데이터 관리] 8. By 또는 Split 파일 프로세싱 [데이터 관리] 8. By 또는 Split 파일 프로세싱 1. Proc SQL By 또는 Split 파일 프로세싱을 위한 PROC SQL 프로그램 Group by 옵션을 이용하여, 성별을 기준으로 지정된 각 함수 처리 SAS Programming proc sql; create table withmooc as select gender, sum(q1) as q1_sum, mean(q2) as q2_mean, min(q3) as q3_min, max(q4) as q4_max from BACK.mydata a group by gender; select * from withmooc; quit; Results gender q1_sum q2_mean q3_min q4_max -----------------------.. 2022. 1. 11.
반응형