언더샘플링1 230410_DB복습 안녕하세요. 보랏입니다. 이번주가 새로 시작되어 바로 복습 내용 올리도록 하겠습니다. 오늘은 언더 샘플링, 오버샘플링에 대한 개념과 이 개념을 알아보기 위해 Kaggle에서 데이터 자료를 가져와 분석을 진행하였으며, Django에서 DB설정 및 홈페이지 제작을 배웠습니다. 바로 복습 시작하겠습니다. 1. 언더샘플링(undersampling) 과 오버샘플링(oversampling) 레이블이 불균형한 분포를 가진 데이터 셋을 학습시킬 때 예측 성능의 문제가 발생할 수 있는데, 이는 이상 레이블을 가지는 데이터 건수가 정상 레이블을 가진 데이터 건수에 비해 너무 적어 발생 즉 이상 레이블을 가지는 데이터 건수는 매우 적기 때문에 제대로 다양한 유형을 학습하지 못하는 반면에 정상 레이블을 가지는 데이터 건수는 .. 2023. 4. 10. 이전 1 다음