일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 백준
- 파이썬
- 공유오피스
- 너무 어렵다
- 코틀린
- 사무실
- 아키텍쳐
- 패파
- childfragment
- 싱글액티비티
- 안드로이드
- media3 transformer
- MVVM
- Android
- innernavigation
- media3
- Kotlin
- 후기
- parentfragment
- 재밌긴함
- 패스트파이브
- fragmentcontainer
- 중첩네비게이션
- SAA
- rxandroid
- 자바
- 스택
- Stack
- 내부프레그먼트
- 알고리즘
목록DB or 파이썬 (6)
삽질도사

피봇테이블을 마치 groupby처럼 사용할 수 있다. pivot = data.pivot_table( ['Salary','Age'], #급여,나이 index=['Position'], #포지션별로 급여,나이를 보겠다. aggfunc = 'mean' #평균 ) pivot 피봇테이블을 사용하면 인덱스가 숫자로 나타나지않아서 활용할 때 힘드니까 인덱스를 넣어보자! pivot2 = pivot.copy() #pivot의 복사본으로 pivot2만들자 pivot2.columns = pivot.columns.values #index를 0~n까지, inplace=True 는 원본에 덮어씌우겠다는 뜻 #pivot의 index가 2개라면 reset_index 2번 반복해서 써주면 됌 pivot2.reset_index(level..

데이터 겨우겨우 찾아서 열심히 읽어오고 전처리 다 해놨더니..이게뭚.. 예 아닙니다. 그냥 한글깨진거예요.. 그냥 한글폰트를 작업해주기만 하면 됩니다. 이건 윈도우에서 이렇게 코드쓰심 됩니다. (한글작업할 때에 기본세팅) from matplotlib import rc # 한글폰트작업 # window의 폰트 위치 -> C:/Windows/Fonts/NGULIM.TTF font_name = font_manager.FontProperties(fname="C:/Windows/Fonts/NGULIM.TTF").get_name() rc('font', family=font_name) plt.rcParams['axes.unicode_minus'] = False 맥에서는 이렇게 쓰시면 됩니다. from matplotli..

https://data.seoul.go.kr/dataList/10181/S/2/datasetView.do# 열린데이터광장 메인 데이터분류,데이터검색,데이터활용 data.seoul.go.kr 을 통해서 가져온 데이터입니다! 어라 근데 우리가 아는 dataframe은 1대1로 행열이 매칭되어 있는데, 이건뭘까 일단 무작정 읽어봅니다. 엑셀은 우리가 처음 본것처럼 나와있고, 이를 텍스트로 보니까 여러개를 묶은 row는 여러번 나온는 것을 볼 수 있습니다. 그럼 3번 텍스트를 dataframe으로 읽어오면 여러번 나오겠죠? 해서 나온 결과가 1번인데, 조금 다르게 합계가 두 번째 나올 때부터는 뒤에 index처럼 1부터 숫자가 붙는 걸 알 수 있습니다. 궁금증해결! -> 하위 항목이 여러개면 여러번 나온다!

이렇게 그래프의 숫자값이 마구 섞여있다면, 자료형을 의심해봐야합니다. 읽어올 때 숫가가 아니라 문자열로 읽어왔다면 마구 섞여서 나타납니다! 따라서 원하는 값을 int값으로 바꿔주면 정상적인 그래프가 그려지게 됩니다. 간단하지만 처음에 삽질하기 쉬운 내용이었습니다~!

원하는 내용을 뽑아올 때 헷갈리기 쉬운거 후딱 정리들어갑니다. 원래의 자료는 Name,Team,Number,Position,Age 등등 열이 많습니다. data = pd.read_csv('nba.csv',sep=',') #데이터 읽음 print(data[['Name','Age']].head(3)) # 대괄호가 2개니까 주의!! print(type(data[['Name','Age']])) #dataframe 타입 print(data.loc[:,['Name','Age']]) #loc을 통해서 뽑아옴 print(type(data.loc[:,['Name']])) #dataframe 타입 print(data.iloc[:][['Name','Age']].head(3)) #i번째 행을 가져와서 'Name','Age'열..

판다스로 자료를 읽어올 때에 unnamed로 인덱싱되어서 자료가 나오는 것이 싫다면 index_col =0을 옵션으로 넣어서 읽으면 일반적으로 생각하는 평범한 자료를 얻을 수 있습니다. (별거 아닌데 몰라서 삽질했음..) import pandas as pd city = pd.read_csv('city.csv') #unnamed가 붙어서 지저분한 모습 print(city.head(3)) city = pd.read_csv('city.csv',index_col = 0) #index_col = 0 으로 깔끔하게 가져옴. print(city.head(3)) tsv의 자료같은 경우에는 탭으로 구분되어 있으므로, sep='\t'이라는 옵션을 넣어서 자료를 가져오면 좋습니다. regions = pd.read_csv("..