浏览代码

konlpy 추가 중

tobby48 5 年前
父节点
当前提交
e46f9324c4

+ 15
- 0
src/main/python/kr/co/swh/lecture/opensource/konlpy/konlpy-ex1.py 查看文件

@@ -0,0 +1,15 @@
1
+# import os
2
+# os.environ['_JAVA_OPTIONS'] = '-Xmx1024M'
3
+# from konlpy import init_jvm
4
+# init_jvm("<JAVA_HOME>")
5
+
6
+from konlpy.tag import Kkma
7
+kkma = Kkma()
8
+sen = kkma.sentences('안녕하세요 SWH코딩학원입니다.')
9
+print(sen)
10
+noun = kkma.nouns('안녕하세요 SWH코딩학원입니다.')
11
+print(noun)
12
+pos = kkma.pos('안녕하세요 SWH코딩학원입니다.')
13
+print(pos)
14
+morph = kkma.morphs('안녕하세요 SWH코딩학원입니다.')
15
+print(morph)

+ 9
- 0
src/main/python/kr/co/swh/lecture/opensource/konlpy/konlpy-ex2.py 查看文件

@@ -0,0 +1,9 @@
1
+from konlpy.tag import Kkma
2
+kkma = Kkma()
3
+
4
+def tokenize(doc):
5
+    # norm은 정규화, stem은 근어로 표시하기를 나타냄
6
+    return ['/'.join(t) for t in kkma.pos(doc)]
7
+
8
+tweet = 'RT @marcobonzanini: just an example! :D http://example.com #NLP'
9
+print(tokenize(tweet))

+ 1
- 0
src/main/python/kr/co/swh/lecture/opensource/konlpy/user_dic.txt 查看文件

@@ -0,0 +1 @@
1
+SWH코딩학원	NNP