EDA 2

서울 자전거 공유 수요 데이터셋을 활용한 대여 수요 예측 실습

서울시의 공공 자전거 대여 서비스인 "따릉이"의 대여 수요를 예측하는 문제에 사용되는 데이터셋.특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용해 자전거 대여 수요를 예측 데이터셋 컬럼 Date : 연월일Rented Bike count - 매 시간마다 대여한 자전거 수Hour - 하루 중 시간Temperature - 온도Humidity - 습도 %Windspeed - 풍속 m/sVisibility - 가시거리 mDew point temperature - 이슬점 온도Solar radiation - 태양 복사 MJ/m2Rainfall - 강우량 mmSnowfall - 적설량 cmSeasons - 겨울, 봄, 여름, 가을Holiday - 휴일/휴일 없음Functional Day..

[과제] 타이타닉 데이터셋(kaggle) 전처리 실습

[과제 안내]다음 단계에 따라 분석을 진행하고 주석과 함께 코드로 정리하세요.1. 데이터 불러오기pandas를 이용해 train.csv 파일을 불러옵니다.2. 기초 EDAinfo(), .describe(), .head() 등을 사용해 데이터 구조와 기본 통계 정보를 확인합니다.3. 결측치 탐색 및 처리각 컬럼의 결측치 개수를 확인하고, Age, Embarked 등 결측치가 있는 컬럼에 적절한 방식으로 값을 채워 넣습니다.4. 범주형 변수 분석Sex, Pclass, Embarked 등 범주형 변수의 고유값(unique), 빈도수(value_counts) 등을 분석합니다.5. 데이터 시각화seaborn, matplotlib을 활용해 주요 변수의 분포나 관계를 시각화합니다.예시: 성별에 따른 생존률 시각화6...