무냐의 개발일지

[머신러닝] 머신러닝에 사용되는 라이브러리 순서!! 본문

데싸 추가 독학

[머신러닝] 머신러닝에 사용되는 라이브러리 순서!!

무냐코드 2024. 2. 19. 12:45
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

from scipy.stats import norm
from scipy import stats

#데이터 전처리 : 스케일링, 정규화, 인코딩
from sklearn import preprocessing
from sklearn.preprocessing import LabelEncoder
from sklearn.preprocessing import StandardScaler

#머신러닝 전단계 : 데이터를 훈련/val 세트로 나누기, 교차검증 
#ensemble : 랜덤포레스트와 같은 알고리즘 제공
from sklearn.model_selection import train_test_split
from sklearn.model_selection import KFold
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import ExtraTreesClassifier

#선형회귀 및 선형모델(Lasso, Ridge, Elastic등) 제공
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import Ridge
from sklearn.linear_model import Lasso
from sklearn.linear_model import ElasticNet

#모델평가를 위한 지표 제공
from sklearn import metrics
from sklearn.metrics import mean_squared_error
from sklearn.metrics import mean_absolute_error
from math import sqrt
from sklearn.metrics import r2_score

 

헷갈리지 않고 확실히 정리 가능!!!

 

* random_state는 모델의 랜덤성을 제어합니다.
: 진짜 아무거나, 어떤 값을 넣어도 상관없다 !!!! 다만, 실험 단계에서는 랜덤성에 의해 학습 결과가 차이 나는 것을 방지하기 위해 하나의 값으로 고정해서 실험하는 것이 좋습니다.