DB or 파이썬
[파이썬] pandas로 파일/자료 깔끔하게 읽어오기(short)
삽질도사
2021. 10. 15. 16:52
반응형
판다스로 자료를 읽어올 때에 unnamed로 인덱싱되어서 자료가 나오는 것이 싫다면 index_col =0을 옵션으로 넣어서 읽으면 일반적으로 생각하는 평범한 자료를 얻을 수 있습니다. (별거 아닌데 몰라서 삽질했음..)
import pandas as pd
city = pd.read_csv('city.csv') #unnamed가 붙어서 지저분한 모습
print(city.head(3))

city = pd.read_csv('city.csv',index_col = 0) #index_col = 0 으로 깔끔하게 가져옴.
print(city.head(3))

tsv의 자료같은 경우에는 탭으로 구분되어 있으므로, sep='\t'이라는 옵션을 넣어서 자료를 가져오면 좋습니다.
regions = pd.read_csv("region.tsv") #tsv는 탭으로 구분되어 있기때문에 처리해주지 않으면 곤란함
print(regions.head(3))

regions = pd.read_csv("region.tsv",sep='\t') #탭으로 구분하여 가져온 모습. (하지만 unnamed가 붙음)
print(regions.head(3))

regions = pd.read_csv("region.tsv",sep='\t',index_col = 0) #index_col = 0 을 통해 깔끔하게 가져옴
print(regions.head(3))

반응형