当前位置:首页 > 日记本 > 正文内容

python jieba分词

zhangchap3年前 (2021-05-25)日记本265
import jieba
from jieba.analyse import tfidf
words = jieba.lcut('美菜网拟赴美上市,“生鲜第一股”有望成真?')
print(words)
#['美菜', '网拟', '赴美', '上市', ',', '“', '生鲜', '第一股', '”', '有望', '成', '真', '?']
nws = tfidf('美菜网拟赴美上市,“生鲜第一股”有望成真?',topK=5)
print(nws)
#['美菜', '网拟', '生鲜', '第一股', '赴美']


标签: python笔记
分享给朋友:

相关文章

python 获取当前的路径并切换

import os curdir = os.path.dirname(__file__) #获取当前的路径,若运行在当前文件夹,是获取不到当前路径的,最保险的...

python jieba分词自定义分词器及自定义词典

import jieba jieba.initialize() # 自定义分词器的写法 n_c = jieba.Tokenizer(dictionary=...

Python 正则表达式 带分组的替换 \g

import re re.sub(r'([^a-z]*)[a-z]([^a-z]*)', '\g<1>\g<2>',wor...

python正则替换替换文本特殊字符和html代码

import re h2 = '「新裤子/痛仰/陈粒/达达」2021贵阳草莓音乐节全阵容公布!' h2 = re.sub(r...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。