Programming Study 43

서울 자전거 공유 수요 데이터셋을 활용한 대여 수요 예측 실습

서울시의 공공 자전거 대여 서비스인 "따릉이"의 대여 수요를 예측하는 문제에 사용되는 데이터셋.특정 시간대와 날씨, 요일, 공휴일 여부, 기온, 습도 등 다양한 데이터를 활용해 자전거 대여 수요를 예측 데이터셋 컬럼 Date : 연월일Rented Bike count - 매 시간마다 대여한 자전거 수Hour - 하루 중 시간Temperature - 온도Humidity - 습도 %Windspeed - 풍속 m/sVisibility - 가시거리 mDew point temperature - 이슬점 온도Solar radiation - 태양 복사 MJ/m2Rainfall - 강우량 mmSnowfall - 적설량 cmSeasons - 겨울, 봄, 여름, 가을Holiday - 휴일/휴일 없음Functional Day..

주택 임대료 예측 실습 (House Rent Prediction Dataset)

http://'https://www.kaggle.com/datasets/iamsouravbanerjee/house-rent-prediction-dataset/data?select=House_Rent_Dataset.csv' * BHK: 주택에 포함된 침실, 거실, 주방의 총 개수를 의미합니다.* Rent: 주택(아파트/플랫)의 월 임대료를 나타냅니다.* Size: 주택(아파트/플랫)의 면적을 평방피트(Square Feet)로 나타냅니다.* Floor: 주택이 위치한 층수와 건물의 총 층수를 나타냅니다. (예: 2층 중 1층, 5층 중 3층 등)* Area Type: 주택의 면적이 어떤 방식으로 계산되었는지를 나타냅니다. (예: 전체 면적, 실사용 면적, 건축 면적 등)* Area Locality: 주택(..

scikit-learn (사이킷런) _ Iris (붓꽃) 데이터 _ SVM (서포트 벡터 머신)

from sklearn.datasets import load_irisiris = load_iris()print(iris)# sepal length in cm: 꽃받침의 길이# sepal width in cm: 꽃받침의 너비# petal length in cm: 꽃잎의 길이# petal width in cm: 꽃잎의 너비print(iris['DESCR'])data = iris['data']datafeature_names = iris['feature_names']feature_names======================================['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']import..

커피 프랜차이즈의 입점 전략 분석

https://www.chosun.com/kid/kid_economy/kid_honeybee/2022/06/02/IKQ2PO4SGRR6MQK5C647LKQJGU/ 선택의 법칙… 스타벅스 옆엔 이디야가 있다?" data-og-description="프랜차이즈 브랜드 立地 선택의 법칙 스타벅스 옆엔 이디야가 있다 스타벅스, 유동 인구 많은 곳 出店 이디야·올리브영, 근처 입점해 매출 효과 파리바게뜨, 횡단보도 인근 맘스터치, 임" data-og-host="www.chosun.com" data-og-source-url="https://www.chosun.com/kid/kid_economy/kid_honeybee/2022/06/02/IKQ2PO4SGRR6MQK5C647LKQJGU/" data-og-url="ht..

서울시 공공자전거 실시간 대여정보 예제

1. 서울시 공공 자전거 실시간 대여 정보 - 인증키 발급 받기 - 서울시 공공자전거 실시간 대여정보 검색 import requests #서버에 연결시키는import foliumimport jsonimport pandas as pdimport warningswarnings.filterwarnings('ignore')base_url = 'http://openapi.seoul.go.kr:8088/(인증키)/json/bikeList/1/3/'response = requests.get(base_url)# print(request)json_data = response.json()json_data{'rentBikeStatus': {'list_total_count': 3, 'RESULT': {'CODE': 'INF..

Folium - 지도 생성 라이브러리

1. Folium이란?Folium은 Python에서 Leaflet.js라는 자바스크립트 라이브러리를 기반으로 한 지도 시각화 라이브러리간단한 코드만으로 지도 기반의 시각화(마커, 경로, 히트맵, 영역 등)를 만들 수 있어. 대표 특징 - HTML 기반 지도 생성 → 웹브라우저에서 시각화 가능- OpenStreetMap, Stamen 등 다양한 지도 타일 지원- 지도 위에 마커, 원, 선, 팝업, 히트맵, Choropleth 등 다양한 요소를 추가 가능- Pandas와 연동하여 DataFrame 기반의 시각화가 용이 # 설치 방법 pip install folium 2. 기본 지도 생성 예제 import folium# 지도 생성: (위도, 경도) 중심, 줌 레벨m = folium.Map(location=[3..

[과제] 타이타닉 데이터셋(kaggle) 전처리 실습

[과제 안내]다음 단계에 따라 분석을 진행하고 주석과 함께 코드로 정리하세요.1. 데이터 불러오기pandas를 이용해 train.csv 파일을 불러옵니다.2. 기초 EDAinfo(), .describe(), .head() 등을 사용해 데이터 구조와 기본 통계 정보를 확인합니다.3. 결측치 탐색 및 처리각 컬럼의 결측치 개수를 확인하고, Age, Embarked 등 결측치가 있는 컬럼에 적절한 방식으로 값을 채워 넣습니다.4. 범주형 변수 분석Sex, Pclass, Embarked 등 범주형 변수의 고유값(unique), 빈도수(value_counts) 등을 분석합니다.5. 데이터 시각화seaborn, matplotlib을 활용해 주요 변수의 분포나 관계를 시각화합니다.예시: 성별에 따른 생존률 시각화6...

[과제] 알고리즘 정의 및 동작 원리 - (7 ~ 10)

7. 탐욕알고리즘 정의 탐욕 알고리즘은 문제를 해결할 때 각 단계에서 가장 좋아 보이는 해답(즉, 지금 이 순간 얻을 수 있는 최대 이득)을 선택하고, 이후에는 되돌아가지 않는 방식으로 전체 해를 구성하는 기법이다.- 매 단계마다 최적의 선택을 함으로써 최종적으로도 최적(또는 근사 최적)의 해를 얻으려는 전략- 대표적으로 동전 거스름돈, 활동 선택, 분수 배낭 문제 등이 있다 특징 국소 최적 선택(Local Optimal Choice)전체 문제를 작은 부분 문제로 나눠, 각 부분에서 최선이라고 판단되는 선택을 즉시 수행되돌아오지 않음(No Backtracking)한 번 내린 선택은 변경하지 않고 다음 단계로 넘어감단순하고 빠름구현이 비교적 간단하며 보통 정렬 또는 우선순위 큐 기반으로 O(N log N)..

[과제] 알고리즘 정의 및 동작원리 - (1~6)

1. 정렬 (Sorting)정렬 알고리즘은 자료들을 특정한 순서대로 배치하는 알고리즘일반적으로 데이터의 특성과 크기, 상황에 따라 적절한 알고리즘을 선택하여 사용정렬 알고리즘의 주요 분류 1. 단순 비교 기반 정렬 (Simple Sort) – O(n²) 버블 정렬(Bubble Sort)선택 정렬(Selection Sort)삽입 정렬(Insertion Sort)데이터 양이 많지 않은 경우 간단하게 구현하기 좋지만, 대규모 데이터에서는 성능이 떨어짐 2. 효율적인 비교 기반 정렬 (Efficient Comparison Sort) – O(n log n) 병합 정렬(Merge Sort)힙 정렬(Heap Sort)퀵 정렬(Quick Sort)대규모 데이터에 적합한 효율적인 정렬 방법 (실제 사용 빈도 높음) ..

[과제] 자료구조 (Data Structure)

0. 자료구조란?정의 데이터를 효율적으로 저장하고 관리해 쉽게 접근하고 수정할 수 있게 만드는 데이터의 구조나 형태. 데이터 처리의 효율성은 어떤 자료 구조를 선택하는 지에 따라 결정됨 좋은 자료 구조를 선택하면?데이터를 빠르고 효율적으로 저장, 검색, 수정, 삭제할 수 있어 프로그램의 전체적인 성능이 향상됨핵심 특징 1. 효율성 자료구조의 가장 중요한 목적은 효율적인 데이터 관리와 처리적절한 자료구조 사용 시 연산의 시간복잡도, 공간복잡도가 개선됨 2. 추상화 (ADT)자료구조는 복잡한 데이터와 연산을 추상화해 필요한 핵심적인 기능만 제공하도록 만듦 불필요한 복잡성을 제거하고 간단한 인터페이스 제공 예 : 큐의 추상적 특징은 FIFO 구조로만 표현하면 충분. 내부가 어떻게 구현되었는지 숨김 3. 재..