xgboost2 230405_DB복습 안녕하세요. 보랏입니다. 오늘은 XGBoost모델 만들기와 Django의 특징, 기초 명령어를 배웠습니다. 복습 시작하겠습니다. 1. XGBoost 모델 만들기 - 붓꽃 데이터 셋 어제 배운 XGBoost를 활용하여 사이킷런에서 제공해주는 datasets 분석 모델을 만들었습니다. import pandas as pd import numpy as np from sklearn import datasets iris = datasets.load_iris() df = pd.DataFrame(data=np.c_[iris['data'], iris['target']], columns=iris['feature_names'] + ['target']) df.head() from sklearn.model_selection i.. 2023. 4. 5. 230403_DB복습 안녕하세요. 보랏입니다. 오늘 또 새로운 한 주가 시작되어 복습 내용 올리도록 하겠습니다. 오늘 배운 내용은 머신러닝 랜덤포레스트, XGBoost와 vscode에서 django설치를 배웠는데, 지금 제 데스크탑에서 계속 오류가 발생해서 다시 해결하는대로 한 번에 올리도록 하겠습니다. 죄송합니다. 복습 시작하겠습니다. 1. 랜덤 포레스트 앙상블 모델(ensemble learning) 정형 데이터를 다루는 데 가장 뛰어난 성과를 내는 알고리즘 랜덤 포레스트 랜덤포레스트는 의사결정트리가 모여서 생성 의사결정트리에서 수 많은 요소(feature)를 기반으로 target을 예측한다면, 오버피팅 발생 따라서 random forest는 전체 feature중 랜덤으로 일부 feature만 선택해 하나의 결정트리를 생성.. 2023. 4. 3. 이전 1 다음