무냐의 개발일지

[Python] Heatmap으로 그래프 그리기 본문

데싸 추가 독학

[Python] Heatmap으로 그래프 그리기

무냐코드 2024. 2. 13. 14:40

상관계수

상관계수는 변수들 간의 관계를 알아볼 때 유용한 개념입니다. 특정 데이터에 대한 상관관계를 볼 수 있습니다. 상관계수는 -1부터 1사이로 구성되고, 0.3부터 0.7 사이면 뚜렷한 양적 선형관계, 0.7 이상이면 강한 양적 상관관계라 할 수 있습니다.

 

# 피처 간 상관관계 히트맵
correlation_matrix = df.corr()
plt.figure(figsize=(10, 8))
sns.heatmap(correlation_matrix, annot=True, fmt = '.2f', cmap='coolwarm', linewidths=0.5)
plt.title('Correlation Heatmap')
plt.show()

* corr(numeric_only= True) 를 해줘야, 수치형 데이터인 애들만 모아서 상관관계를 보여준다

* fmt : 숫자의 format, 소수점 몇째자리까지 나타낼지를 보여준다

* cmap : 색상 지정

 

 

2. Mask  (매트릭스에서 상삼각, 하삼각 지정)

 

mask = np.triu(np.ones_like(corr, dtype = np.bool))

그래프 아래만 보여준다

 

corr_h = USAhousing.corr(numeric_only=True)
mask = np.triu(np.ones_like(corr_h, dtype=bool))
sns.heatmap(corr_h, annot=True, fmt='.2f', mask=mask)

 

 

3. vmax, vmin : 농도 지정