반응형

판다스 2

dacon 버스 운행시간 예측 프로젝트 1

https://dacon.io/edu/1003 개요 파이썬 기반의 데이터 분석 및 인공지능 기술을 활용하여 버스 운행 시간을 예측하는 프로젝트입니다. 목표 데이터 분석 및 인공지능 기술을 활용하여 정확한 버스 운행 시간을 예측할 수 있는 능력을 갖춥니다. 데이터 전처리, 시각화, 통계적 분석, 머신러닝 및 딥러닝 모델링 등 다양한 기법을 배우고, 실제 데이터를 바탕으로 예측 모델을 개발하세요! 설명 실제 교통 문제를 해결하는 데 도움이 되는 현실적인 응용 프로젝트입니다. 이를 통해 데이터 분석 및 인공지능 기술의 가치를 직접 체험하며 도시 교통 문제 개선을 위한 방법을 찾아 보세요! 인공지능 기술의 사회적 가치와 책임에 대한 인식을 높이고, 교통 문제를 해결함으로써 지속 가능한 도시 환경을 만드는 데 기..

Base 2023.05.31

전국 음식점 데이터 전처리

행정안전부_일반음식점 데이터를 기준으로 데이터 정리를 해보았다. 먼저 판다스를 이용하여 파일을 로드했다 정부 관련 파일들은 대부분 인코딩 형식이 cp949이다. encoding='cp949'를 추가한다. import pandas as pd df = pd.read_csv("./fulldata_07_24_04_P_일반음식점.csv", encoding='cp949') 데이터 프레임은 206만 123개의 row가 있다. 전국 음식관련 업종이 206만여개가 있다는 뜻이다. 하지만 영업상태명을 보았을때 폐업이 있는 것으로 보아 현재 영업중인 파일만 출력하기로 한다. # 폐업구분 df = df.query("영업상태명!='폐업'") 영업상태명컬럼에서 폐업이 아닌 데이터만 남긴다. 2,060,123 rows -> 691..

Python 2023.04.20
반응형