본문 바로가기
오라클 게시판/오라클 함수

【오라클(Oracle) SQL 함수】 STATS_ONE_WAY_ANOVA 함수

by 기서무나구물 2021. 10. 20.

포스팅 목차

    o STATS_ONE_WAY_ANOVA

     


    문법

     

    stats_one_way_anova::=

     


    목적 

    일원분산분석 함수(STATS_ONE_WAY_ANOVA)는 분산의 다른 2개 추정치 비교하여 통계적 유의성에 대한 평균(그룹 또는 변수에 대한)의 유의한 차이를 검증한다. 

    첫 번째 추정치는 각 그룹 또는 카테고리 내의 분산에 근거한다. 이것은 그룹 내 평균 제곱 또는 평균제곱오차로 알려졌다. 다른 추정치는 그룹의 평균 사이의 분산에 근거한다. 이것은 그룹 간 평균 제곱으로 알려졌다. 만약 그룹의 평균이 유의한 차이가 있다면, 그룹 간 평균 제곱은 기댓값보다 커져서 그룹 간 평균 제곱과 일치하지 않는다. 만약 그룹의 평균 제곱이 일치하면, 두 개의 분산 추정치는 거의 같다.

    STATS_ONE_WAY_ANOVA함수는 3개의 인수를 취한다. 두 개의 식과 VARCHAR2 타입의 반환 값을 취한다. expr1은 독립변수 또는 그룹 집합에서 데이터를 분할하는 그룹핑 변수이다. expr2는 그룹의 각 멤버에 상응하는 값을 포함한 종속 변수(수치 표현)이다. 함수는 3번째 인수의 값에 의해 정의에 따라 하나의 수치를 반환한다. 만약 3번째 인수를 생략하면, 기본값은 SIG이다. 반환 값의 의미는 Table 7-8 참조.

     

    표 7-8 STATS_ONE_WAY_ANOVA 반환 값

    SUM_SQUARES_BETEEN 그룹간 제곱합 (Sum of squares between groups)
    SUM_SQUARES_WITHIN 그룹내의 제곱합(Sum of squares within groups)
    DF_BETWEEN 그룹간 자유도(Degree of freedom for between groups)
    DF_WITHIN 그룹내 자유도(Degree of freedom for within groups)
    MEAN_SQUARES_BETWEEN 그룹간 평균 제곱(Mean squares between groups)
    MEAN_SQUARES_WITHIN 그룹내 평균 제곱(Mean squares within groups)
    F_RATIO 그룹내 평균 제곱 사이의 평균 제곱의 비율(Ratio of the mean squares between to the mean squares within (MSB/MSW))
    SIG 유의성(Significance)

    일원분산분석의 유의성은 그룹 간 평균 제곱과 그룹 내 평균 제곱의 비율에 대한 f검정의 한쪽 꼬리 유의성이 통용되는 것에 의해 판단된다. f검정은 한쪽 꼬리 유의성이 이용될 필요가 있는데, 그 이유는 그룹 간 평균 제곱은 그룹 내 평균 제곱 이상에서만 될 수 있기 때문이다. 그러므로, STATS_ONE_WAY_ANOVA에 의해 반환되는 유의성은, 그룹 간 차이가 우연에 의해 발생할 확률(0과 1 사이의 수자) 확률이다. 이 수치가 작으면, 그룹 간 차이의 유의성이 더 커진다. f검정 실행의 정보는 STATS_F_TEST 참조.

     


    관련 함수

    함수명 함수내용
    STATS_BINOMIAL_TEST 두 개의 유효한 값이 존재하는 이분형 변수(이분 변수, 두 개의 배타적인 값을 가지는 변수)에 대해서 동질성 검증을 위한 정확도 검증 작업(Exact probability test)을 수행한다.
    STATS_CROSSTAB 두 개의 명목 변수를 분석하는 방법이다. 
    STATS_F_TEST 두 개의 분산이 유의한 차가 있는지 테스트(F 검정)한다.
    STATS_KS_TEST 두 개의 표본이 같은 모집단에 속하고 있는지 또는 동일한 분포를 가지는 모집단에 속하고 있는지 테스트하는 Kolmogorov-Smirnov함수이다.
    STATS_MODE 값의 집합을 인수로 취하여, 가장 큰 빈도를 가지는 값(최빈값, mode)을 반환한다.
    STATS_MW_TEST A Mann Whitney test는 2개의 독립 표본(independent samples)을 비교한다.
    STATS_ONE_WAY_ANOVA 일원분산분석 함수(STATS_ONE_WAY_ANOVA)는 분산의 다른 2개 추정치 비교하여 통계적 유의성에 대한 평균(그룹 또는 변수에 대한)의 유의한 차이를 검증한다. 
    STATS_T_TEST_* t검정은 평균의 차이의 유의성을 측정한다.

    • STATS_T_TEST_ONE: 일 표본 t검정
    • STATS_T_TEST_PAIRED: 이 표본 대응 t검정(crossed t-test로 알려짐.)
    • STATS_T_TEST_INDEP: 같은 분산을 가지는 2개 독립 그룹의 t검정(합동 분산(Pooled variance))
    • STATS_T_TEST_INDEPU: 다른 분산을 가지는 2개 독립 그룹의 t검정(비 합동 분산)
    STATS_WSR_TEST 대응쌍 표본의 윌콕스 부호 순위 검증(Wilcoxon Signed Ranks test)을 수행하여 표본간의 차이가 유의한 차이가 있는지 여부를 검정한다.

     


    예제 

    • STATS_ONE_WAY_ANOVA 예제

    다음 예제는 수입 수준 내에서 평균 판매 차이와 수입 수준 간에서 평균 판매 차이의 유의성을 검증한다. P_value가 0에 가까운 결과는 남성과 여성에 대하여 서로 다른 소득 수준에 대한 상품 판매 금액의 차이는 유의하다.

    Oracle Program
    SELECT cust_gender,
           STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'F_RATIO') f_ratio,
           STATS_ONE_WAY_ANOVA(cust_income_level, amount_sold, 'SIG') p_value
    FROM   sh.customers c, sh.sales s
    WHERE  c.cust_id = s.cust_id
    GROUP BY cust_gender;

     

    Results
    C    F_RATIO    P_VALUE
    - ---------- ----------
    F 5.59536943 4.7840E-09
    M  9.2865001 6.7139E-17

     

     


    오라클 SQL 함수(Oracle SQL Function) 목록 리스트 링크

     

    [SQL, Pandas, R Prog, Dplyr, SQLDF, PANDASQL, DATA.TABLE] SQL EMP 예제로 만나는 테이블 데이터 처리 방법 리스트 링크
    반응형

    댓글