교차검증2 Bootstrapping 교차 검증이란 무엇인가? 부트스트래핑(bootstrapping)은 통계학에서 사용되는 재표본화(resampling) 방법 중 하나입니다. 이 방법은 주어진 데이터 집합으로부터 복원 추출(반복 추출)을 통해 샘플을 생성하고, 이를 통해 통계적 추론이나 예측을 수행하는 방법입니다. 부트스트래핑은 특히 데이터가 한정적인 경우에 유용하게 활용됩니다. 부트스트래핑의 작동 방식은 다음과 같습니다: 원본 데이터에서 복원 추출: 주어진 데이터 집합에서 무작위로 데이터를 선택하고, 선택된 데이터를 다시 원본 데이터에 복원합니다. 이 과정을 원하는 횟수만큼 반복합니다. 복원 추출은 데이터 집합의 크기와 동일한 크기의 샘플을 생성합니다. 통계 계산: 각 복원 추출된 샘플에 대해 통계량(예: 평균, 분산, 회귀 계수 등)을 계산합니다. 이렇게 생성된.. 2023. 6. 2. K-fold 교차검증 이란 무엇인가? k-fold 교차 검증(k-fold cross-validation)은 기계 학습 모델의 성능을 평가하기 위한 통계적 방법 중 하나입니다. 주어진 데이터를 여러 개의 부분 집합으로 나누고, 각각의 부분 집합을 훈련 및 검증에 사용하여 모델의 성능을 평가합니다. 일반적으로 k-fold 교차 검증은 다음과 같은 단계로 진행됩니다: 데이터 분할: 주어진 데이터를 k개의 동일한 크기의 부분 집합으로 나눕니다. 이때, 각 부분 집합을 '폴드'라고 합니다. 예를 들어, k를 5로 설정하면 데이터는 5개의 폴드로 나누어집니다. 모델 훈련 및 검증: k개의 폴드 중 하나를 선택하여 검증 세트로 사용하고, 나머지 k-1개의 폴드를 훈련 세트로 사용하여 모델을 훈련합니다. 이 과정을 k번 반복하며, 각 반복에서 다른 폴드를.. 2023. 6. 2. 이전 1 다음