Programming Study/Python & AI 22

PyTorch 프레임워크

1. PyTorch란?파이토치는 메타에서 개발한 오픈소스 딥러닝 프레임워크 기존의 TensorFlow보다 코드가 직관적이고 Pythonic해서, 연구자와 개발자 모두에게 인기가 많다. 쉽게 말하면, 딥러닝 모델을 만들고 훈련시키기 위한 도구이자, GPU (cuda) 병렬 연산도 지원하는 고성능 수치 계산 라이브러리 2. PyTorch의 주요 특징(1) 동적 계산 그래프 : 실행 시점에 연산 그래프를 생성 (디버깅 및 실험 용이)딥러닝 모델이 학습 및 예측을 수행할 때 계산 그래프를 실행 시점에 실시간으로 생성 및 수정하는 방식. 이 방식은 조건문, 반복문 등 복잡한 논리 구조를 유연하게 처리할 수 있음. 계산 그래프는 입력 데이터를 바탕으로 연산을 수행하면서 그래프를 생성하고, 역전파를 통해 미분을 계..

호텔 예약 수요 데이터셋, 고객 행동 예측, 수요 예측 실습

https://www.kaggle.com/datasets/jessemostipak/hotel-booking-demand Hotel booking demandFrom the paper: hotel booking demand datasetswww.kaggle.com1. 데이터 전처리 및 EDA import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plthotel_df = pd.read_csv("/hotel_bookings.csv")hotel_df.info()===================================================RangeIndex: 119390 entries, 0 to 11..

서울 자전거 공유 수요 데이터셋을 활용한 대여 수요 예측 실습

서울시의 공공 자전거 대여 서비스인 "따릉이"의 대여 수요를 예측하는 문제에 사용되는 데이터셋.특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용해 자전거 대여 수요를 예측 데이터셋 컬럼 Date : 연월일Rented Bike count - 매 시간마다 대여한 자전거 수Hour - 하루 중 시간Temperature - 온도Humidity - 습도 %Windspeed - 풍속 m/sVisibility - 가시거리 mDew point temperature - 이슬점 온도Solar radiation - 태양 복사 MJ/m2Rainfall - 강우량 mmSnowfall - 적설량 cmSeasons - 겨울, 봄, 여름, 가을Holiday - 휴일/휴일 없음Functional Day..

주택 임대료 예측 실습 (House Rent Prediction Dataset)

http://'https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset/data?select=House_Rent_Dataset.csv' * BHK: 주택에 포함된 침실, 거실, 주방의 총 개수를 의미합니다.* Rent: 주택(아파트/플랫)의 월 임대료를 나타냅니다.* Size: 주택(아파트/플랫)의 면적을 평방피트(Square Feet)로 나타냅니다.* Floor: 주택이 위치한 층수와 건물의 총 층수를 나타냅니다. (예: 2층 중 1층, 5층 중 3층 등)* Area Type: 주택의 면적이 어떤 방식으로 계산되었는지를 나타냅니다. (예: 전체 면적, 실사용 면적, 건축 면적 등)* Area Locality: 주택(..

scikit-learn (사이킷런) _ Iris (붓꽃) 데이터 _ SVM (서포트 벡터 머신)

from sklearn.datasets import load_irisiris = load_iris()print(iris)# sepal length in cm: 꽃받침의 길이# sepal width in cm: 꽃받침의 너비# petal length in cm: 꽃잎의 길이# petal width in cm: 꽃잎의 너비print(iris['DESCR'])data = iris['data']datafeature_names = iris['feature_names']feature_names======================================['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']import..

커피 프랜차이즈의 입점 전략 분석

https://www.chosun.com/kid/kid_economy/kid_honeybee/2022/06/02/IKQ2PO4SGRR6MQK5C647LKQJGU/ 선택의 법칙… 스타벅스 옆엔 이디야가 있다?" data-og-description="프랜차이즈 브랜드 立地 선택의 법칙 스타벅스 옆엔 이디야가 있다 스타벅스, 유동 인구 많은 곳 出店 이디야·올리브영, 근처 입점해 매출 효과 파리바게뜨, 횡단보도 인근 맘스터치, 임" data-og-host="www.chosun.com" data-og-source-url="https://www.chosun.com/kid/kid_economy/kid_honeybee/2022/06/02/IKQ2PO4SGRR6MQK5C647LKQJGU/" data-og-url="ht..

서울시 공공자전거 실시간 대여정보 예제

1. 서울시 공공 자전거 실시간 대여 정보 - 인증키 발급 받기 - 서울시 공공자전거 실시간 대여정보 검색 import requests #서버에 연결시키는import foliumimport jsonimport pandas as pdimport warningswarnings.filterwarnings('ignore')base_url = 'http://openapi.seoul.go.kr:8088/(인증키)/json/bikeList/1/3/'response = requests.get(base_url)# print(request)json_data = response.json()json_data{'rentBikeStatus': {'list_total_count': 3, 'RESULT': {'CODE': 'INF..

Folium - 지도 생성 라이브러리

1. Folium이란?Folium은 Python에서 Leaflet.js라는 자바스크립트 라이브러리를 기반으로 한 지도 시각화 라이브러리간단한 코드만으로 지도 기반의 시각화(마커, 경로, 히트맵, 영역 등)를 만들 수 있어. 대표 특징 - HTML 기반 지도 생성 → 웹브라우저에서 시각화 가능- OpenStreetMap, Stamen 등 다양한 지도 타일 지원- 지도 위에 마커, 원, 선, 팝업, 히트맵, Choropleth 등 다양한 요소를 추가 가능- Pandas와 연동하여 DataFrame 기반의 시각화가 용이 # 설치 방법 pip install folium 2. 기본 지도 생성 예제 import folium# 지도 생성: (위도, 경도) 중심, 줌 레벨m = folium.Map(location=[3..

[과제] 타이타닉 데이터셋(kaggle) 전처리 실습

[과제 안내]다음 단계에 따라 분석을 진행하고 주석과 함께 코드로 정리하세요.1. 데이터 불러오기pandas를 이용해 train.csv 파일을 불러옵니다.2. 기초 EDAinfo(), .describe(), .head() 등을 사용해 데이터 구조와 기본 통계 정보를 확인합니다.3. 결측치 탐색 및 처리각 컬럼의 결측치 개수를 확인하고, Age, Embarked 등 결측치가 있는 컬럼에 적절한 방식으로 값을 채워 넣습니다.4. 범주형 변수 분석Sex, Pclass, Embarked 등 범주형 변수의 고유값(unique), 빈도수(value_counts) 등을 분석합니다.5. 데이터 시각화seaborn, matplotlib을 활용해 주요 변수의 분포나 관계를 시각화합니다.예시: 성별에 따른 생존률 시각화6...

[과제] 알고리즘 정의 및 동작 원리 - (7 ~ 10)

7. 탐욕알고리즘 정의 탐욕 알고리즘은 문제를 해결할 때 각 단계에서 가장 좋아 보이는 해답(즉, 지금 이 순간 얻을 수 있는 최대 이득)을 선택하고, 이후에는 되돌아가지 않는 방식으로 전체 해를 구성하는 기법이다.- 매 단계마다 최적의 선택을 함으로써 최종적으로도 최적(또는 근사 최적)의 해를 얻으려는 전략- 대표적으로 동전 거스름돈, 활동 선택, 분수 배낭 문제 등이 있다 특징 국소 최적 선택(Local Optimal Choice)전체 문제를 작은 부분 문제로 나눠, 각 부분에서 최선이라고 판단되는 선택을 즉시 수행되돌아오지 않음(No Backtracking)한 번 내린 선택은 변경하지 않고 다음 단계로 넘어감단순하고 빠름구현이 비교적 간단하며 보통 정렬 또는 우선순위 큐 기반으로 O(N log N)..