행정안전부_일반음식점 데이터를 기준으로 데이터 정리를 해보았다. 먼저 판다스를 이용하여 파일을 로드했다 정부 관련 파일들은 대부분 인코딩 형식이 cp949이다. encoding='cp949'를 추가한다. import pandas as pd df = pd.read_csv("./fulldata_07_24_04_P_일반음식점.csv", encoding='cp949') 데이터 프레임은 206만 123개의 row가 있다. 전국 음식관련 업종이 206만여개가 있다는 뜻이다. 하지만 영업상태명을 보았을때 폐업이 있는 것으로 보아 현재 영업중인 파일만 출력하기로 한다. # 폐업구분 df = df.query("영업상태명!='폐업'") 영업상태명컬럼에서 폐업이 아닌 데이터만 남긴다. 2,060,123 rows -> 691..