当前位置:首页 > 日记本 > 正文内容

python 简单计算两个文本的相似度

zhangchap1年前 (2023-04-03)日记本281
import difflib

def get_similarity(text1, text2):
    # 计算两个文本之间的相似度
    similarity = difflib.SequenceMatcher(None, text1, text2).ratio()
    print(similarity)
    return similarity

# 示例用法
text1 = "请问从南充寄回四川省自贡市荣县的快递要多久 "
text4 = "请问从南充寄回四川荣县的快递要多久 "
text2 = "四川(约263.991何应钦四川,四川和士兵伤亡全国人民抗日军事和民用两个十分之一秒的一个第二次死亡,受伤,失踪356.267 26.025人,共64人,包括在排名最靠前的国家统计!)"
text3 = "正常快递的省内件就1-2天,最多不超过3天,不同的快递公司中转方式不一样,一般南充-成都-自贡-荣县,不过发的时候最好先咨询下您发的那家快递能不能到荣县,省的麻烦,无疑要保证时效的话,还是选择顺丰吧 "
similarity1 = get_similarity(text1, text3)
similarity2 = get_similarity(text1, text2)
similarity3 = get_similarity(text1, text4)


分享给朋友:

相关文章

配置存储(IIS 7)

适用于:Windows 7,Windows Server 2008,Windows Server 2008 R2,Windows Vista IIS 7使用一种新的...

网络编辑工具箱注册ComCtl32.ocx

1.把ComCtl32.ocx放到c:\Windows\SysWOW64,注:需要管理员权限 2.打开C:\Windows\System32 找到 cmd.exe 鼠标右键管理员身份...

如何为精简的 CSS 文件删除未使用的 CSS

如何为精简的 CSS 文件删除未使用的 CSS

精简的网站比臃肿的网站运行得更快,这已经不是什么秘密了。不要让不必要的 CSS 拖累您的 Web 项目;使用下面描述的工具和技术来帮助您删除未使用的 CSS 并提高您网站的整体性能。什么是未使用的 C...

python下elasticsearch简单接口操作

# -*- coding:utf-8 -*- # elasticsearch 默认算法bm25 from elasticsearch&n...

python md5生成

from hashlib import md5 md5_hash = md5(title.encode('utf-8')).hexd...

python下elasticsearch搜索接口介绍

# elasticsearch 默认算法bm25 from elasticsearch import Elasticsearch import&n...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。