머신러닝 (3) 썸네일형 리스트형 [AWS SageMaker] US census data for population segmentation https://aws.amazon.com/ko/blogs/machine-learning/analyze-us-census-data-for-population-segmentation-using-amazon-sagemaker/ Analyze US census data for population segmentation using Amazon SageMaker | Amazon Web Services August 2021: Post updated with changes required for SageMaker SDK v2, courtesy of Eitan Sela, Senior Startup Solutions Architect In the United States, with the 2018 midterm elect.. SMOTE : Over Sampling 요즘 DACON 문제를 풀고 있다. https://dacon.io/competitions/official/235689/overview/ 운동 동작 분류 AI 경진대회 출처 : DACON - Data Science Competition dacon.io 해당 문제를 풀면서 과적합이 일어났고, 모델 성능을 높이기 쉽지 않았다. 그 문제가 데이터의 부족은 아니였을까 하는 생각에 Over Sampling 을 시도했다. 신용카드 사기 등 이상값을 검출하는 모델을 구상할 때, "이상" 레이블 데이터에 비해 "정상" 레이블 데이터가 지나치게 많을 경우, 모델이 정상 레이블을 검출하는 것에 초점이 맞춰진다. '이상'이라고 한 만큼 데이터의 부족이 있을 수 밖에 없지만 레이블의 불균형은 모델.. 선형 회귀 모델 선형 회귀 모델은 실제 값과 예측 값의 차이(오류의 제곱값)를 최소화하는 최적화된 직선형 회귀선을 찾는 방식. 규제(Regularization) 방법에 따라 별도의 유형으로 분류 가능. 규제란 일반적인 선형 회귀의 과적합 문제를 해결하기 위해 회귀 계수에 패널티 값을 적용하는 것. 선형 회귀 모델 종류 - 일반 선형 회귀 : 규제를 적용하지 않은 베이직 모델 - 릿지(Ridge) : 선형회귀에 L2 규제를 추가한 회귀 모델. L2 규제는 상대적으로 큰 회귀 계수 값의 예측 영향도를 감소시키기 위해 회귀 계수 값을 더 작게 만드는 규제 방식. - 라쏘(Rasso) : L1 규제를 적용한 방식. 예측 영향력이 작은 피처의 회귀 계수를 0으로 만들어 회귀 예측 시 피터가 선택되지 않게 하는 것. 피처 선택 기.. 이전 1 다음