리그캣의 개발놀이터

자연어 처리 NLP란? 본문

프로그래밍 언어/Python

자연어 처리 NLP란?

리그캣 2018. 1. 23. 15:41

NLP 무엇인가?

NLP (Natural Language Processing, 자연어처리) 텍스트에서 의미있는 정보를 분석, 추출하고 이해하는 일련의 기술집합이다.

우리 일상에도 다양한 NLP 응용사례가 있습니다. 가령:

         텍스트 요약(ex: Summly)

         자동 질의응답 시스템(ex: Wolfram Alpha)

         대화 시스템(ex: Apple Siri)

         기계 번역(ex: Google Translate)

KoNLPy

KoNLPy(“코엔엘파이라고 읽습니다) 한국어 정보처리를 위한 파이썬 패키지입니다.(http://konlpy-ko.readthedocs.io/ko/v0.4.3/)

설치하기

우분투

         명령 프롬프트로 KoNLPy 설치하기

$ sudo apt-get install g++ openjdk-7-jdk # Install Java 1.7+

$ sudo apt-get install python-dev; pip install konlpy     # Python 2.x

$ sudo apt-get install python3-dev; pip3 install konlpy   # Python 3.x

         MeCab 설치하기 (선택사항)

$ sudo apt-get install curl

$ bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)

윈도우

1.        Java 1.7 이상이 설치되어 있어야한다.

2.        JAVA_HOME 설정하기

3.        JPype1 (>=0.5.7) 다운로드 받고 설치. 다운 받은 .whl 파일을 설치하기 위해서는 pip 업그레이드 해야 있다.

> pip install --upgrade pip

> pip install JPype1-0.5.7-cp27-none-win_amd64.whl

         명령 프롬프트로 KoNLPy 설치하기

> pip install konlpy

         KoNLPy Mecab() 클래스는 윈도우에서 지원되지 않는다.

Comments