통계적 유의성 (statistical significance) 은 통계 분석 결과가 우연에 의한 것이 아니라 실제로 존재하는 패턴 또는 차이를 나타내는 것인지를 판단하는 것을 의미합니다. 즉, 통계적 유의성은 관찰된 결과가 우연에 의한 것이 아니라 진짜로 의미 있는 것인지를 확인하는 통계적 검증 과정입니다.
통계적 유의성은 주로 가설 검정(Hypothesis Testing)과 관련이 있습니다. 가설 검정은 주어진 데이터를 기반으로 특정 가설을 검증하는 과정으로, 보통 "귀무 가설"과 "대립 가설"을 설정하고 이를 통계적으로 평가합니다. 귀무 가설은 일반적으로 기존의 믿음이나 가정을 나타내며, 대립 가설은 관심 대상이 되는 새로운 주장이나 가정을 의미합니다.
통계적 유의성은 가설 검정을 통해 얻은 결과에서 유추될 수 있습니다. 검정 통계량(예: t-값, F-값)을 계산하고, 이를 통계적 분포와 비교하여 유의 수준(significance level, alpha)과 비교합니다. 유의 수준은 주로 0.05 또는 0.01로 설정되며, 검정 통계량이 이 경계값을 초과하거나 미만일 때 결과를 통계적으로 유의하다고 판단합니다. alpha 는 null hypothesis 을 rejecting 할 확율이며, 결과가 틀렸을 수 있는 risk를 받아들일 수 있는 정도라고 말할 수 있습니다.
p-value (Probability value) <= alpha
통계적 유의성은 연구나 실험 결과의 신뢰성과 신빙성을 평가하는 데 중요한 개념입니다. 유의성이 있는 결과는 우연에 의한 것이 아니라 실제로 존재하는 패턴이나 차이를 반영하므로, 해당 결과에 대한 결론을 더욱 신뢰할 수 있게 합니다.
'Machine Learning' 카테고리의 다른 글
Data Science의 대표적인 도구들은? (0) | 2023.05.24 |
---|---|
labelling 되어있지 않은 대량의 data를 해석하는 방법 (0) | 2023.05.24 |
왜 AI, Machine Learning 을 써야 하는가? (0) | 2023.05.24 |
Data science 용어 정리 (0) | 2023.05.24 |
dplyr 와 pandas 차이점 (0) | 2023.05.12 |