2026/01/07 3

SEABORN

1. Seaborn의 핵심 가치: 통계적 시각화Matplotlib 기반: 모든 Seaborn 그래프는 Matplotlib 객체다. 따라서 세밀한 조정은 Matplotlib 문법을 섞어 쓸 수 있다.데이터 프레임 친화적: Pandas 데이터 프레임의 컬럼 이름을 직접 지정해 그래프를 그릴 수 있어 직관적이다.통계 내장: 데이터의 평균, 신뢰구간, 밀도 추정(KDE) 등을 별도 계산 없이 자동으로 그려준다.2. 데이터 분석의 첫걸음: 특성(Feature) 이해데이터를 받으면 가장 먼저 컬럼(특성)들이 무엇을 의미하는지 봐야 한다.예시 데이터독립변수 (Feature, 특성)종속변수 (Target, Label)분석 포인트보스톤 주택방 개수, 범죄율, 면적, 학군주택 가격어떤 특성이 가격에 가장 큰 영향을 주는가..

머신러닝 2026.01.07

MATPLOTLIB

데이터 시각화 matplotlib 설치 plt.plot(y)처럼 y 값만 전달했을 때 Matplotlib은 다음과 같이 동작한다.인덱스 활용: 데이터의 개수(n)를 파악한 뒤, 0부터 n-1까지의 정수를 $x$ 값으로 자동 생성한다.좌표 대응: 주어진 예시 y = [1, 2, 3, 4]의 경우, 내부적으로 생성된 x = [0, 1, 2, 3]과 결합하여 (0, 1), (1, 2), (2, 3), (3, 4) 지점을 선으로 잇는다.import matplotlib.pyplot as plty = [1,2,3,4] # x값을 안 넣으면 알아서 값을 넣어준다plt.plot(y)plt.show() 독립변수와 종속변수의 정의데이터 분석과 머신러닝에서 두 변수는 다음과 같은 역할을 수행한다.독립변수 (Indepen..

머신러닝 2026.01.07

넘파이(NumPy) 2

1. 특수 배열 생성: zeros, ones, eye배열을 초기화할 때 연산의 목적에 따라 적절한 함수를 선택해야 한다.np.zeros((rows, cols)): 모든 요소가 0인 행렬. 초기화 후 값을 더해나가는 누적 연산의 베이스로 주로 사용한다.np.ones((rows, cols)): 모든 요소가 1인 행렬. 곱셈의 항등원 역할을 하며, 특정 값을 전체에 곱해주기 전 기초 행렬로 사용한다.np.eye(n) (Identity Matrix): 대각 성분만 1이고 나머지는 0인 단위 행렬이다. 선형대수에서 숫자 1과 같은 역할을 수행한다. 2. 로그 스케일과 logspacenp.logspace(start, stop, num): 로그 스케일로 등간격인 숫자를 생성한다.3. 차원 변형: flatten vs ..

머신러닝 2026.01.07