본문 바로가기
개인공부/Python(Anaconda, NLTK)

Python (Pandas.Series)

by 저세상판단 2019. 10. 11.
반응형

Pandas ( 사용하기 위해 import pandas ) (뒤에 추가로 as 후 원하는 명으로 변경 가능 / import pandas as pd )

 - 데이터 분석을 할 때 가장 많이 사용되는 라이브러리 중 하나.

1. Series - 일련의 객체를 담을 수 있는 1차원 배열과 같은 자료 구조 ( index 와 values 를 통해 색인 및 값 지정 가능 )

  예 ) @value(값) 대입

         obj = pandas.Series([1, 2, 3, 4])    // 데이터 생성

       @value(값) 확인

         obj    //값 확인

         또는

         obj.values    //값 확인

       @index(색인) 확인

         obj.index    //인덱스 확인

       @value(값) 선택 또는 대입 시 index(색인)을 통해 접근

         obj2 = pandas.Series([1, 2, 3, 4] index = ['a', 'b', 'c', 'd'])    //데이터 생성, index는 a, b, c, d로 설정, a = 1, b = 2, c = 3, d = 4

         obj2['a']    //index a 의 값을 출력 -> 1

         ->결과 : 1

         obj2['a'] = 15     //index a 의 값을 설정 -> a = 15

         obj2['a']

         ->결과 : 15

       @누락된 값 찾기

         obj2.isnull()    //obj2는 현재 15, 2, 3, 4 값이 들어가 있으므로 모두 false가 반환된다.

 

Reference. 잡아라! 텍스트 마이닝 with 파이썬, 서대호 저, 비제이퍼블릭

 

반응형

'개인공부 > Python(Anaconda, NLTK)' 카테고리의 다른 글

Python(PorterStemmer, LancasterStemmer, RegexpStemmer)  (0) 2019.10.14
Python (re)  (0) 2019.10.14
Python(numpy)  (0) 2019.10.11
Python (Pandas.DataFrame)  (0) 2019.10.11
Install NLTK on Windows(윈도우 NLTK 설치)  (0) 2019.10.10