무냐의 개발일지
[머신러닝] 머신러닝에 사용되는 라이브러리 순서!! 본문
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from scipy.stats import norm
from scipy import stats
#데이터 전처리 : 스케일링, 정규화, 인코딩
from sklearn import preprocessing
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import StandardScaler
#머신러닝 전단계 : 데이터를 훈련/val 세트로 나누기, 교차검증
#ensemble : 랜덤포레스트와 같은 알고리즘 제공
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import ExtraTreesClassifier
#선형회귀 및 선형모델(Lasso, Ridge, Elastic등) 제공
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import Ridge
from sklearn.linear_model import Lasso
from sklearn.linear_model import ElasticNet
#모델평가를 위한 지표 제공
from sklearn import metrics
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
from math import sqrt
from sklearn.metrics import r2_score
헷갈리지 않고 확실히 정리 가능!!!
* random_state는 모델의 랜덤성을 제어합니다.
: 진짜 아무거나, 어떤 값을 넣어도 상관없다 !!!! 다만, 실험 단계에서는 랜덤성에 의해 학습 결과가 차이 나는 것을 방지하기 위해 하나의 값으로 고정해서 실험하는 것이 좋습니다.
'데싸 추가 독학' 카테고리의 다른 글
파이썬 클래스, 객체, 계좌만들기 실습 (0) | 2024.04.08 |
---|---|
ARIMA 모델에서 가장 중요한 정상성 확인 | ADFuller test에 대하여 (0) | 2024.02.29 |
[데이터 과학을 위한 통계]#1 EDA 탐색적 데이터분석 (0) | 2024.02.18 |
[Python] Heatmap으로 그래프 그리기 (0) | 2024.02.13 |
[Python] Scaling (MinMaxScaler, StandardScaler), PCA(차원축소) (0) | 2024.02.11 |