본문 바로가기
Bigdata/Energy Bigdata

[Pandas] csv파일 가져오는 것 부터 복습/utf-8 encoding error 해결

by 겨울 빛 2020. 12. 12.

할일 계속 밀려서 종강하고 쓰려 그랬는데 개념이 정리가 안돼서 도저히 기말 발표 준비를 할 수가 없다.

그래서 조금씩 처음부터 다시 써야겠다 😥

1_supply.csv로 변환함

내가 기말발표로 분석할 자료는 이 데이터다

국가에너지통계종합정보시스템(https://www.kesis.net) 에서 가져왔고, 이 CSV파일을 분석하는 이유는,,

주제가 에너지전환이기 때문이다!

 

중간발표때 기말때 이 주제로 발표하겠다고 미리 계획해두긴 했지만

얼마전에 발표한 2050탄소중립선언 덕분에 (실시간 라이브 본거 자랑.)

운좋게(?) 에너지전환 데이터 분석할 명분 한 가지 더 생김 

 

1차 에너지 공급 자료에는 1차 에너지원별 연도별 공급량(단위: toe)이 1981년도부터 나와있어서 분석하게 되면

약 30년간의 공급량 변화추이를 알 수 있다.

 

근데 처음으로 내용복습하는거라 아주 무지한 상태임. ㅠ

파일 import 해오는 것 부터 다시 쓴다.

import pandas as pd
from datetime import datetime
import matplotlib.pyplot as plt
import matplotlib as mpl
import seaborn as sns

# 폰트 설정
plt.rc('font', family='NanumGothic')
# 마이너스 설정
mpl.rcParams['axes.unicode_minus']=False

df = pd.read_csv('1_supply.csv', encoding='cp949')
df.head(25)

혹시 나중에 쓸 수도 있어서 seaborn패키지도 일단 불러와봤다

 

그런데 진짜 아무리봐도 오류 없는데 계속 오류나는거임! 

 

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 26: invalid start byte 

 

 

요렇게 뜸 ㅂㄷ

이유는 맥에서는 utf-8 로 인코딩 하고 윈도우에서는 cp949로 인코딩 한다고,,

(제ㅂㅏㄹ좀 하나로 통일해줘)

 

 

df=pd.read_csv('파일명.csv')     <- 오류

df=pd.read_csv('파일명.csv', encoding='cp949')

 

 

 

이렇게 간단하게 해결할 수 있다고 한다.............................

시작부터 오류나서 극대노 할뻔 했지만 고마운 구글 쓰앵님들 덕분에 참았다

 

천하제일코딩못하기대회 열면 내가 1등먹지 않을까 싶다

오늘도 역시 코딩만 하면 너무 화가난다

댓글