Pandas ( 사용하기 위해 import pandas ) (뒤에 추가로 as 후 원하는 명으로 변경 가능 / import pandas as pd )
- 데이터 분석을 할 때 가장 많이 사용되는 라이브러리 중 하나.
1. Series - 일련의 객체를 담을 수 있는 1차원 배열과 같은 자료 구조 ( index 와 values 를 통해 색인 및 값 지정 가능 )
예 ) @value(값) 대입
obj = pandas.Series([1, 2, 3, 4]) // 데이터 생성
@value(값) 확인
obj //값 확인
또는
obj.values //값 확인
@index(색인) 확인
obj.index //인덱스 확인
@value(값) 선택 또는 대입 시 index(색인)을 통해 접근
obj2 = pandas.Series([1, 2, 3, 4] index = ['a', 'b', 'c', 'd']) //데이터 생성, index는 a, b, c, d로 설정, a = 1, b = 2, c = 3, d = 4
obj2['a'] //index a 의 값을 출력 -> 1
->결과 : 1
obj2['a'] = 15 //index a 의 값을 설정 -> a = 15
obj2['a']
->결과 : 15
@누락된 값 찾기
obj2.isnull() //obj2는 현재 15, 2, 3, 4 값이 들어가 있으므로 모두 false가 반환된다.
Reference. 잡아라! 텍스트 마이닝 with 파이썬, 서대호 저, 비제이퍼블릭
'개인공부 > Python(Anaconda, NLTK)' 카테고리의 다른 글
Python(PorterStemmer, LancasterStemmer, RegexpStemmer) (0) | 2019.10.14 |
---|---|
Python (re) (0) | 2019.10.14 |
Python(numpy) (0) | 2019.10.11 |
Python (Pandas.DataFrame) (0) | 2019.10.11 |
Install NLTK on Windows(윈도우 NLTK 설치) (0) | 2019.10.10 |