numpy(Numerical Python) 과학 계산 컴퓨팅과 데이터 분석에 필요한 라이브러리. (import numpy)
- 다차원 배열 ndarray, 선형대수, 난수발생, 전체 데이터 배열에 대해 빠른 연산을 제공 등
1. ndarray ( 다차원 배열 )
@데이터 생성
data = numpy.random.randn(2, 3) //데이터 생성
@자유로운 사칙연산 가능
data*2, data+data+data 등 //data*2 = 모든 값에 *2, data+data+data = 모든 값을 세 번 더함
@배열 차원 크기를 확인
data..shape //shape 메서드를 통해 차원의 크기 확인 가능
@배열의 data type 확인
data.dtype //dtype 메서드를 통해 data type 확인 가능, 일반 자료형(정수, 실수, 불린 등 확인할때는 type(변수명)
@배열을 0 또는 1의 값 만으로 생성
AllZero = numpy.zeros((3, 6)) //모든 데이터 값이 0인 3행 6열의 2차원 배열 생성
AllOne = numpy.ones((3, 6)) //모든 데이터 값이 1인 3행 6열의 2차원 배열 생성
AllRand = numpy.empty((4, 6)) //모든 데이터 값이 랜덤인 4행 6열의 2차원 배열 생성
@index(색인)을 통해 데이터 값에 접근
arr = numpy.arange(10) // 0~9 까지의 상수가 들어간 10칸 짜리 배열 생성
(arr([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) arr의 데이터 값)
arr[5] //5번 째 index에 있는 값 -> 5
결과 -> 5 //5번 째 index에 있는 값 -> 5
@다차원 배열도 index(색인)을 통해 접근 가능
arr2d = numpy.array([[1, 2, 3], [4, 5, 6]]) //2차원 배열 생성
arr2d[1] //1행의 데이터 출력, 결과 -> array([4, 5, 6])
arr2d[1][0] //1행 0열의 데이터 출력, 결과-> 4
@슬라이스를 이용하여 index(색인) 가능 슬라이스 색인 -> 시작점:끝점 (두 값중 한 값이 생략 될 시 시작점(0) 또는 끝점(데이터 길이)로 자동 할당
arr2d = arr2d[:2, 1:] // [ 0~1, 1~2]까지 반환
결과 -> array([[2, 3], [5, 6]])
Reference. 잡아라! 텍스트 마이닝 with 파이썬, 서대호 저, 비제이퍼블릭
'개인공부 > Python(Anaconda, NLTK)' 카테고리의 다른 글
Python(PorterStemmer, LancasterStemmer, RegexpStemmer) (0) | 2019.10.14 |
---|---|
Python (re) (0) | 2019.10.14 |
Python (Pandas.DataFrame) (0) | 2019.10.11 |
Python (Pandas.Series) (0) | 2019.10.11 |
Install NLTK on Windows(윈도우 NLTK 설치) (0) | 2019.10.10 |