2023.09.06 ~ 2023.9.13 (7일)
- 강한얼(PM) : 데이터 수집 및 전처리 / 데이터 EDA / 머신러닝 모델 학습 / PPT 제작
- 조태상 : 데이터 전처리 / 데이터 EDA / PPT 제작 / crawling(not use)
- 퇴근시간 가산디지털단지역에서 7호선을 타려면 1~2대의 지하철을 보내야 한다. 널널하게 지하철을 이용할 수 있는 시간대는?
- 또한 모델 학습을 통해서 지하철 승하차 인원을 예측하면?
- 서울시 지하철 승하차 인원과 날씨 데이터를 이용하여 지하철 승하차에 영향을 미치는 원인을 분석하고, 미래 지하철 이용자 수를 예측해본다.
- EDA를 통해 지하철 승하차 인원에 영향을 미치는 변수 탐색
- 미래 지하철 이용자 수를 예측하는 머신러닝 모델 학습 결과 분석
- pandas 2.0.3
- numpy 1.23.5
- seaborn 0.12.2
- matplotlib 3.7.2
- koreanize matplotlib 0.1.1
- Southkorea
- lightbgm
- shap
- 서울교통공사 연도별 일별 시간대별 역별 승하차 인원
- 주소링크
- 수집 기간 2018 ~ 2022 (5년)
- 서울 교통공사 관할 지하철 1 ~ 8 호선
- 1시간 간격 승하차 인원 정보
- 데이터 형태
- 서울교통공사 지하철역 주소 및 전화번호 정보
- 주소링크
- 지하철역의 위치를 알아내기 위해 사용
- 데이터 형태
- 종관기상관측(ASOS)
- 주소링크
- 수집 기간 2018 ~ 2022 (5년)
- 서울 특별시 관측소 수집 기상 데이터
- 날씨를 파악하기 위해 정해진 시각에 모든 관측소에서 관측을 같은 시각에 실시하는 지상관측
- 데이터 형태
- 실행 코드
- 결과 샘플
- 실행 코드
- 결과 샘플
- 실행 코드
- 결과 샘플