데이터 탐색과 시각화
10.2.1 공분산 - 공분산 : 서로 공유하는 분산 = 두 분산의 관계 x1변수 각 값의 편차(해당 값 - 평균)와 x2변수 각 값의 편차를 곱한 값을 모두 더해준 후 전체 개수 n(표본은 n-1)으로 나눠준다. 10.2.2 상관계수 - 공분산은 꽤나 단순한 원리로 변수 간의 상관과계를 수치화한 것임 → 한계 존재 각 변수 간의 다른 척도기준이 그대로 반영되어 공분산 값이 지니는 크기가 상관성의 정도를 나타내지 못함 예를 들어, x1과 x2의 공분산 값이 1300이고 x3와 x4의 공분산 값이 800이라고 할때, x1과 x2의 상관관계가 x3와 x4의 상관관계보다 크다고 할 수 없음 이러한 단점을 해결하기 위해 각 변수를 정규화화여 상관성을 비교함 이때, 많이 사용하는 것이 피어슨 상관계수 피어슨 상관..
책 리뷰/데이터 분서가가 반드시 알아야 할 모든 것
2023. 10. 1. 17:14
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- #파이썬 #자료형
- 공분산
- #파이썬 #클래스 #인스턴스
- #파이썬 #numpy
- #파이썬 #그래프
- # 파이썬 # 반복문 # 제어문 #if문
- 상관계수
- #파이썬 # 제어문 # 반복문 #for문
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
글 보관함