반응형 개인공부/Python(Anaconda, NLTK)7 Python (wordCloud) 실습 Jupyter Notebook 사용 원래 트럼프 사진에 맞게 모양이 나와야 되는데 잘 안됐다. 글씨에 색깔이 들어가는 것은 원래 사진의 색깔이 있는 부분에 비슷한 색이 들어가는 것이다. 텍스트 문서 경로와 사진 경로, 폰트 경로는 자신의 경로에 맞게 설정 해줘야 한다. 소스 : https://github.com/Youngjin-kwon/Python/blob/master/WordCloud(Trump).py 2019. 10. 14. Python(PorterStemmer, LancasterStemmer, RegexpStemmer) 어근 동일화 라이브러리 (ProterStemmer, LancasterStemmer, RegexpStemmer) PorterStemmer, LancasterStemmer, RegexpStemmer 세 라이브러리 중 어떤 것을 사용 하더라도 상관 없다. 사용법은 동일하되 LancasterStemmer의 경우 from nltk.stem.lancaster import lancasterStemmer 를 RegexpStemmer의 경우 from nltk.stem.regexp import RegexpStemmer 와 객체 생성시 RS_stemmer = RegexpStemmer("python") 를 입력해주면 된다. 2019. 10. 14. Python (re) re - 라이브러리의 한 종류로 주로 정규 표현식을 구현할 때 사용, 메소드로는 sub, compule, findall등이 있다. 정규 표현식 기호 및 설명 1. * : 바로 앞에 있는 문자, 하위 표현식이 0번 이상 반복됨을 나타냄 2. + : 바로 앞에 있는 문자, 하위 표현식이 1번 이상 반복됨을 나타냄 3. [] : 대괄호 안에 있는 문자 중 하나가 나타남 4. () : 괄호 안의 정규식을 하위 표현식 그룹으로 만듦, 정규 표현식을 평가할 때는 하위 표현식이 가장 먼저 평가됨 5. . : 어떠한 형태든 문자 1자를 나타냄 6. ^ : 바로 뒤에 있는 문자, 하위 표현식이 문자열 맨 앞에 나타남 7. $ : 바로 앞에 있는 문자, 하위 표현식이 문자열 맨 뒤에 나타남 8. {m} : 바로 앞에 있는.. 2019. 10. 14. Python(numpy) numpy(Numerical Python) 과학 계산 컴퓨팅과 데이터 분석에 필요한 라이브러리. (import numpy) - 다차원 배열 ndarray, 선형대수, 난수발생, 전체 데이터 배열에 대해 빠른 연산을 제공 등 1. ndarray ( 다차원 배열 ) @데이터 생성 data = numpy.random.randn(2, 3) //데이터 생성 @자유로운 사칙연산 가능 data*2, data+data+data 등 //data*2 = 모든 값에 *2, data+data+data = 모든 값을 세 번 더함 @배열 차원 크기를 확인 data..shape //shape 메서드를 통해 차원의 크기 확인 가능 @배열의 data type 확인 data.dtype //dtype 메서드를 통해 data type 확인.. 2019. 10. 11. 이전 1 2 다음 반응형