Python 3

XGBoost를 활용한 이진 분류 및 3차원 시각화 실습 (with Python)

1. 코드의 목적과 역할 분석 make_classification 으로 3개 특성(Feature)을 가진 이진 분류용 인위적 데이터 셋(500개 샘플)을 만들고, XGBoost(xgb.train)로 모델을 학습,예측한 뒤 정확도를 평가하고 3D 시각화로 결과를 한눈에 보여주는 예제 데이터 생성 - 데이터 분할 - DMatrix 변환 - 모델 학습 - 평가 - 3D시각화 2. 필수 라이브러리 sklearn.datasets : 가상 데이터셋 생성 (make_classification)sklearn.model_selection : 데이터셋 분할 sklearn.metrics. : 정확도 계산 (accuracu_score)xgboost : XGBoost 분류 모델 구축 및 학습 matplotlib : 데이터 ..

Data Analysis Study 2025.07.08

서브 플롯 subplot : 여러 개의 그래프를 하나의 창에 정리해서 보여줌

목표 : 4개의 그래프를 2행 2열로 한 화면에 그리기 1. 제조사별 도시 연비 (boxplot)2. 배기량 vs 고속도로 연비 (scatterplot)3. 제조사별 평균 고속도로 연비 (barplot)4. 연도별 평균 도시 연비(lineplot) 0. 전체 코드 구조 import matplotlib.pyplot as plt import seaborn as snsimport pandas as pd # 데이터 로딩 df = pd.read_csv('assets/mpg.csv')# 그래프 스타일 설정 sns.set(style = 'whitegrid')plt.rcParams.update({'font.family': 'Malgun Gothic'}) # 한글 폰트plt.figure(figsize=(14, 8)) ..

Data Analysis Study 2025.05.27

데이터 불러오기, 기초 탐색, 데이터 프레임 다루기

데이터 불러오기, 기초 탐색 import pandas as pddf = pd.read_csv('assets/exam3.csv')exam3.csv = 학생의 시험 점수 데이터 (국어, 영어, 수학) describe 숫자형 데이터에 대한 통계 제공 (평균, 표준편차, 최소값, 최대값, 사분위수 Q1, Q2, Q3)# 기본 5행 출력 print(df.head()) # 기초 통계 요약print(df.describe())----- 출력 예시 ------ id math eng korcount 20.00000 20.000000 20.000000 20.000000mean 10.50000 55.300000 64.200000 61.4..

Data Analysis Study 2025.05.26