무냐의 개발일지
[Python] Heatmap으로 그래프 그리기 본문
상관계수
상관계수는 변수들 간의 관계를 알아볼 때 유용한 개념입니다. 특정 데이터에 대한 상관관계를 볼 수 있습니다. 상관계수는 -1부터 1사이로 구성되고, 0.3부터 0.7 사이면 뚜렷한 양적 선형관계, 0.7 이상이면 강한 양적 상관관계라 할 수 있습니다.
# 피처 간 상관관계 히트맵
correlation_matrix = df.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, fmt = '.2f', cmap='coolwarm', linewidths=0.5)
plt.title('Correlation Heatmap')
plt.show()
* corr(numeric_only= True) 를 해줘야, 수치형 데이터인 애들만 모아서 상관관계를 보여준다
* fmt : 숫자의 format, 소수점 몇째자리까지 나타낼지를 보여준다
* cmap : 색상 지정
2. Mask (매트릭스에서 상삼각, 하삼각 지정)
mask = np.triu(np.ones_like(corr, dtype = np.bool))
그래프 아래만 보여준다
corr_h = USAhousing.corr(numeric_only=True)
mask = np.triu(np.ones_like(corr_h, dtype=bool))
sns.heatmap(corr_h, annot=True, fmt='.2f', mask=mask)
3. vmax, vmin : 농도 지정
'데싸 추가 독학' 카테고리의 다른 글
[머신러닝] 머신러닝에 사용되는 라이브러리 순서!! (0) | 2024.02.19 |
---|---|
[데이터 과학을 위한 통계]#1 EDA 탐색적 데이터분석 (0) | 2024.02.18 |
[Python] Scaling (MinMaxScaler, StandardScaler), PCA(차원축소) (0) | 2024.02.11 |
[Python] 머신러닝 절차 (1) | 2024.02.11 |
[파이썬] 열/ 행 숫자제한 없이 다 보는 방법 (Pandas)/ corr 상삼각,하삼각행렬 표시 (0) | 2024.02.08 |