【오라클(Oracle) SQL 함수】 STATS_ONE_WAY

포스팅 목차

o STATS_ONE_WAY_ANOVA

문법

stats_one_way_anova::=

목적

일원분산분석 함수(STATS_ONE_WAY_ANOVA)는 분산의 다른 2개 추정치 비교하여 통계적 유의성에 대한 평균(그룹 또는 변수에 대한)의 유의한 차이를 검증한다.

첫 번째 추정치는 각 그룹 또는 카테고리 내의 분산에 근거한다. 이것은 그룹 내 평균 제곱 또는 평균제곱오차로 알려졌다. 다른 추정치는 그룹의 평균 사이의 분산에 근거한다. 이것은 그룹 간 평균 제곱으로 알려졌다. 만약 그룹의 평균이 유의한 차이가 있다면, 그룹 간 평균 제곱은 기댓값보다 커져서 그룹 간 평균 제곱과 일치하지 않는다. 만약 그룹의 평균 제곱이 일치하면, 두 개의 분산 추정치는 거의 같다.

STATS_ONE_WAY_ANOVA함수는 3개의 인수를 취한다. 두 개의 식과 VARCHAR2 타입의 반환 값을 취한다. expr1은 독립변수 또는 그룹 집합에서 데이터를 분할하는 그룹핑 변수이다. expr2는 그룹의 각 멤버에 상응하는 값을 포함한 종속 변수(수치 표현)이다. 함수는 3번째 인수의 값에 의해 정의에 따라 하나의 수치를 반환한다. 만약 3번째 인수를 생략하면, 기본값은 SIG이다. 반환 값의 의미는 Table 7-8 참조.

표 7-8 STATS_ONE_WAY_ANOVA 반환 값

SUM_SQUARES_BETEEN	그룹간 제곱합 (Sum of squares between groups)
SUM_SQUARES_WITHIN	그룹내의 제곱합(Sum of squares within groups)
DF_BETWEEN	그룹간 자유도(Degree of freedom for between groups)
DF_WITHIN	그룹내 자유도(Degree of freedom for within groups)
MEAN_SQUARES_BETWEEN	그룹간 평균 제곱(Mean squares between groups)
MEAN_SQUARES_WITHIN	그룹내 평균 제곱(Mean squares within groups)
F_RATIO	그룹내 평균 제곱 사이의 평균 제곱의 비율(Ratio of the mean squares between to the mean squares within (MSB/MSW))
SIG	유의성(Significance)

일원분산분석의 유의성은 그룹 간 평균 제곱과 그룹 내 평균 제곱의 비율에 대한 f검정의 한쪽 꼬리 유의성이 통용되는 것에 의해 판단된다. f검정은 한쪽 꼬리 유의성이 이용될 필요가 있는데, 그 이유는 그룹 간 평균 제곱은 그룹 내 평균 제곱 이상에서만 될 수 있기 때문이다. 그러므로, STATS_ONE_WAY_ANOVA에 의해 반환되는 유의성은, 그룹 간 차이가 우연에 의해 발생할 확률(0과 1 사이의 수자) 확률이다. 이 수치가 작으면, 그룹 간 차이의 유의성이 더 커진다. f검정 실행의 정보는 STATS_F_TEST 참조.

관련 함수

함수명	함수내용
STATS_BINOMIAL_TEST	두 개의 유효한 값이 존재하는 이분형 변수(이분 변수, 두 개의 배타적인 값을 가지는 변수)에 대해서 동질성 검증을 위한 정확도 검증 작업(Exact probability test)을 수행한다.
STATS_CROSSTAB	두 개의 명목 변수를 분석하는 방법이다.
STATS_F_TEST	두 개의 분산이 유의한 차가 있는지 테스트(F 검정)한다.
STATS_KS_TEST	두 개의 표본이 같은 모집단에 속하고 있는지 또는 동일한 분포를 가지는 모집단에 속하고 있는지 테스트하는 Kolmogorov-Smirnov함수이다.
STATS_MODE	값의 집합을 인수로 취하여, 가장 큰 빈도를 가지는 값(최빈값, mode)을 반환한다.
STATS_MW_TEST	A Mann Whitney test는 2개의 독립 표본(independent samples)을 비교한다.
STATS_ONE_WAY_ANOVA	일원분산분석 함수(STATS_ONE_WAY_ANOVA)는 분산의 다른 2개 추정치 비교하여 통계적 유의성에 대한 평균(그룹 또는 변수에 대한)의 유의한 차이를 검증한다.
STATS_T_TEST_*	t검정은 평균의 차이의 유의성을 측정한다. STATS_T_TEST_ONE: 일 표본 t검정 STATS_T_TEST_PAIRED: 이 표본 대응 t검정(crossed t-test로 알려짐.) STATS_T_TEST_INDEP: 같은 분산을 가지는 2개 독립 그룹의 t검정(합동 분산(Pooled variance)) STATS_T_TEST_INDEPU: 다른 분산을 가지는 2개 독립 그룹의 t검정(비 합동 분산)
STATS_WSR_TEST	대응쌍 표본의 윌콕스 부호 순위 검증(Wilcoxon Signed Ranks test)을 수행하여 표본간의 차이가 유의한 차이가 있는지 여부를 검정한다.

예제

STATS_ONE_WAY_ANOVA 예제

다음 예제는 수입 수준 내에서 평균 판매 차이와 수입 수준 간에서 평균 판매 차이의 유의성을 검증한다. P_value가 0에 가까운 결과는 남성과 여성에 대하여 서로 다른 소득 수준에 대한 상품 판매 금액의 차이는 유의하다.

Oracle Program

SELECT cust_gender,
       STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'F_RATIO') f_ratio,
       STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'SIG') p_value
FROM   sh.customers c, sh.sales s
WHERE  c.cust_id = s.cust_id
GROUP BY cust_gender;

Results

C    F_RATIO    P_VALUE
- ---------- ----------
F 5.59536943 4.7840E-09
M  9.2865001 6.7139E-17

오라클 SQL 함수(Oracle SQL Function) 목록 리스트 링크

[SQL, Pandas, R Prog, Dplyr, SQLDF, PANDASQL, DATA.TABLE] SQL EMP 예제로 만나는 테이블 데이터 처리 방법 리스트 링크

저작자표시 (새창열림)

'오라클 게시판 > 오라클 함수' 카테고리의 다른 글

[오라클 SQL 함수] STATS_WSR_TEST 함수 (0)	2021.10.20
【오라클(Oracle) SQL 함수】 STATS_T_TEST_* 함수 (0)	2021.10.20
【오라클(Oracle) SQL 함수】 STATS_MW_TEST 함수 (0)	2021.10.20
【오라클(Oracle) SQL 함수】 STATS_MODE 함수 (0)	2021.10.20
【오라클(Oracle) SQL 함수】 STATS_KS_TEST 함수 (0)	2021.10.20

【오라클(Oracle) SQL 함수】 STATS_ONE_WAY_ANOVA 함수

o STATS_ONE_WAY_ANOVA

문법

목적

관련 함수

예제

'오라클 게시판 > 오라클 함수' 카테고리의 다른 글

댓글

티스토리툴바

【오라클(Oracle) SQL 함수】 STATS_ONE_WAY_ANOVA 함수

o STATS_ONE_WAY_ANOVA

문법

목적

관련 함수

예제

'오라클 게시판 > 오라클 함수' 카테고리의 다른 글

관련글

댓글

티스토리툴바