当前位置:首页 > 技术杂坛

python 文本清洗(网址、邮箱HTML转义字符)、自动分段等

zhangchap2年前 (2022-05-30)539
记录下这个模块,日后用得着:from harvesttext import HarvestText ht = HarvestText() pr...

多线程代理ip切换实例

zhangchap2年前 (2022-02-17)194
# -*- coding:utf-8 -*- """ 多线程代理ip切换实例 """ from&nbs...

python运行js代码的几种方式:subprocess、execjs

zhangchap2年前 (2021-11-23)323
一、subprocess 模块import subprocess ret = subprocess.check_output(['node','...

掌握 Python 中的网页抓取:从头开始抓取

zhangchap3年前 (2021-09-07)239
Ander 是一名 Web 开发人员,他在多家初创公司工作了 10 多年,曾与各种行业和技术合作。工程师转为企业家。 您是否尝试过抓取数千个页面?进一步扩展?处理系统故障并从中恢复?在了解了如何从...

elasticsearch相关概念

zhangchap3年前 (2021-09-07)225
集群:有多台服务器,每台服务器都运行这ESindex:索引,相当于数据库index_type:"_doc" # 数据表document:数据信息mapping映射字段类型:bina...

widow下elasticsearch的启动

zhangchap3年前 (2021-09-07)216
widow下elasticsearch的启动
找到 elasticsearch的安装路径,进入bin目录:D:\elasticsearch\bin在其路径栏 输入 cmd进入doc命令窗口,自动切换到 当前路径然后输入 elasticsearch...

python计算字符串相似度总结

zhangchap3年前 (2021-08-20)632
1、距离计算包的安装:pip install python-Levenshteinlevenshtein编辑距离(Edit Distance),又称Levenshtein距离,...

10 个用于格式化、组织和整理 CSS 代码的免费工具

zhangchap3年前 (2021-08-01)362
10 个用于格式化、组织和整理 CSS 代码的免费工具
如果您是一位经验丰富的网页设计师,您可能不会遇到这个问题。您的 CSS 文件将结构连贯且简洁;每个选择器都将被仔细放置,每个属性都将被完美格式化……您的 CSS 将看起来像精心制作的艺术品。如果这描述...

python 字典排序

zhangchap3年前 (2021-07-10)248
prefix_word = {'怎么': 4, '昨晚': 27, '会': 56...

python正则替换替换文本特殊字符和html代码

zhangchap3年前 (2021-06-25)303
import re h2 = '「新裤子/痛仰/陈粒/达达」2021贵阳草莓音乐节全阵容公布!' h2 = re.sub(r...