Skip to content

EDA 프로젝트 8조 저장소. 지역별 생활폐기물 현황 분석

License

Notifications You must be signed in to change notification settings

addinedu-ros-3rd/eda-repo-8

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

14 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

지역별 생활폐기물 현황 분석


프로젝트 기간

  • 2023.09.06 ~ 2023.09.12 (7일)

팀 구성

  • 1인 프로젝트

분석 목적

1. 지역별 가구 특성과 생활 폐기물 발생 양상의 상관관계 여부 확인

2. 상관이 있다면 그 정도를 상관계수 및 그 신뢰성(p-value)로 확인



구성도

지역별 폐기물 데이터 구조

image

데이터 전처리: pandas

image

시각화: seaborn

image

공분산, 상관계수, p-value 계산: numpy, scipy

image

실행하려면

  • 라이브러리 설치
pip install -r requirements.txt
  • db property 파일 설정: DB 접속은 config.ini 파일로 설정했습니다. git에 연동하지 않았으므로, 다음과 같은 형태로 생성이 필요합니다.
[dev]
host = 
port = 
user = 
password = 
database = 
  • 파일 생성 후, 2가지 방법 중 택1
    1. src/00_01.create_table.ipynb 실행
    2. yun_project.sql 파일(mysqldump) 사용
      • 덮어쓸 새 데이터베이스에 접속 후
      source yun_project.sql
      
  • 파일명이나 경로, 형식을 수정하고 싶다면 코드의 이 부분을 참고해 주세요. (ipynb 파일의 최상단, import 아랫부분에 있습니다.)
config = configparser.ConfigParser()
config.read('../config.ini')
dev = config['dev']

발표자료

https://docs.google.com/presentation/d/1hABXeKkpYN_hCG8XYs-6Jznr-U8220AZZT0lpReLpHU/edit#slide=id.p

분석 도구

  • 언어: Python
  • RDB: mysql(AWS RDS)
  • 라이브러리: matplotlib, pandas, seaborn, numpy, scipy
    • matplotlib, pandas, seaborn을 사용해 산점도와 회귀 직선을 그렸습니다.
    • numpy와 scipy를 사용해 상관계수와 p-value를 구했습니다.
  • 자료
    • 2021년 전국 생활폐기물 통계
    • 2022년 인구총조사

특이사항

  • seaborn, matplotlib 스타일 설정 시 한글 폰트가 자주 깨지는 이슈가 있었습니다. 라이브러리 간 버전 충돌로 보입니다.
  • 코드 수정 시 다시 발생할 수 있으며, (ubuntu 20.04 기준) matplotlib의 캐시를 삭제 후 라이브러리를 다시 import하면 한글이 정상 출력됩니다.
rm -rf ~/.cache/matplotlib/*

통계자료 출처

참고자료

About

EDA 프로젝트 8조 저장소. 지역별 생활폐기물 현황 분석

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published