선형회귀 3

선형회귀 실습 (당뇨병 진행률 BMI, 광고비 기반 매출 예측)

사용 데이터 : sklearn.datasets.load_diabetes() (10개 특성을 가진 당뇨병 데이터셋) 사용 알고리즘 : LinearRegression() - 단순 선형 회귀 평가 방법 : 시각화를 통한 예측선과 실제값 비교 시각화 : matplotlib를 통한 산점도 + 회귀선 import pandas as pd #데이터 프레임 형태로 조작할 수 있는 도구 (이번 예제에서 직접 사용은 안함)import numpy as np #수치 계산용 (차원 변형 np.newaxis에 사용)import matplotlib.pylot as plt #시각화 (그래프 출력)from sklearn.linear_model import LinearRegression #선형회귀모델 from sklearn.datas..

Data Analysis 2025.06.17

Regression 회귀 알고리즘, 선형회귀, 릿지회귀, 라쏘회귀, 다항회귀, SVR, 랜덤포레스트

회귀 (Regression)주로 연속성 있는 데이터 (대표적으로 시계열 데이터)의 숫자 값을 예측하는 통계적 방법 회귀 분석은 데이터를 통해 아래와 같은 질문에 구체적인 수치로 답을 얻기 위한 방법 예 : 이 아파트는 얼마에 팔릴까?내일의 온도는 몇 도일까?다음 달 매출이 어떻게 될까?=> 회귀분석은 숫자 형태로 연속성을 갖는 값(continuous)을 예측하는 것 선형회귀 (Linear Regression)선형 관계를 가정하여 직선을 이용한 예측을 수행, 입력값(X)과 출력값(Y) 사이에 일직선 관계가 있다고 가정 수학적으로는 y = ax + b 형태로 표현됨 즉 : x와 y가 연속형이고 선형관계일 때 사용 y = 예측하고 싶은 값 x = 예측에 사용되는 데이터 (독립변수)a = 기울기(변수 간 ..

Data Analysis 2025.06.17

Linear Regression (선형 회귀)

1. 선형회귀란?입력변수(x)와 출력값(y) 사이의 직성 관계를 모델링하는 통계적 기법 (x가 커질수록 y가 어떻게 바뀌니?를 직선 하나로 예측하는 모델) 예 : 공부시간 (x) -> 시험점수 (y)공부시간이 늘면 점수도 늘어난다 -> 이걸 직선으로 표현 수식 : y = ax + ba = 기울 기 -> x가 1 늘어날 때 y가 얼마나 변하나 b = x가 0일 때 y는 얼마인가? * 핵심 개념 요소 의미독립변수 X입력값, 원인종속변수 y결과값, 예측하고 싶은 값가설 함수ŷ = wX + b손실 함수오차 측정용: MSE (평균 제곱 오차)학습 목표오차를 최소화하는 w, b 찾기 * 사용 예시 1. 집갑 예측 (면적 -> 가..

Data Analysis 2025.06.08