궁금증 연구소

안녕하세요. 궁금증연구소입니다.

오늘 포스팅 주제는 "파이썬 머신러닝 판 다스 데이터 분석 chapter 2 정리"입니다.

 

ch01

  1. Series 두 개 인덱스 값 보기 ex) sr[[1,2]] ( 대갈호 두 개임)
  2. DataFrame.rename( index={기존 인덱스:새로운 인덱스}, inplace=True} // inplace는 원본 변경 없으면 새로운 객체 리턴
  3. DataFrame.drop(행 인덱스 or 배열, axis =0) default는 0
  4. DataFrame.drop(열 이름 or 배열, axis = 1)
  5. DataFrame [0:5] >>> 끝 인덱스는 포함되지 않는다.
  6. df.index , df.columns 에 직접 값을 넣으면 원본이 바뀐다.
  7. 행을 선택하는 방법 : loc (location)——- 끝번호 포함 , iloc(integer location) —- 끝번호 포함 x
               >>> 이어져 있는 데이터를 인덱스 할때는 [ ] 없이 : 로 한다.
    
  8. df.loc [ ] >>> 떨어져 있는 값을 각각 선택할 때 [ ]로 감싸준다.
  9. 열을 선택하는 방법 : df [”열 이름”]!! 2중대 괄호를 사용해야 함 , df. 열 이름
  10. 범위 splicing df [ : : 2] >>> 짝수 행만 indexing 된다. / df[ : : -1] >>> 역수 인덱싱 된다.
  11. df.set_index( 새롭게 index로 지정할 열 이름, inplace=True) // 인덱스를 새롭게 지정 df.reset_index() >> 정수 인덱스로 되돌리기
  12. df.set_index( [’a’ ,’b’] >>> 멀티 인덱스
  13. 열추가 : df [’ 추가하려는 열 이름’] = 데이터 값
  14. 행 추가 : df.loc [’ 새로운 행 이름’] = 데이터 값 or 배열 []
  15. df.T ⇒ 행렬 바꾸기
  16. df.reindex([새로운 인덱스 배열], fill_value = 0 ) // 새로운 인덱스 배열 중 기존 배열에 없던 행은 NaN이 초기화됨. fill_value는 이 값을 채우는 값
  17. df.sort_index(ascending=False)
  18. df.sort_values()
  19. sr.add(sr2, fill_value=0)
  20. df + 정수 ⇒>> 인덱스를 제외하고 모든 숫자에 사칙연산 적용/ 데이터 프레임에 문자열이 있으면 안 됨
  21. df + '문자열'  >> 에러 발생

반응형

공유하기

facebook twitter kakaoTalk kakaostory naver band
loading