当前位置:首页 > 日记本 > 正文内容

python selenium 抓取信息代码示例

zhangchap2年前 (2022-04-02)日记本373
from selenium.webdriver import Chrome
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time
web = Chrome()
# 打开网页
web.get('https://www.lagou.com/')
# 定位元素
el = web.find_element(By.XPATH,'//*[@id="changeCityBox"]/p[1]/a')
# 点击
el.click()
# 找到输入框,send.keys 输入 python,然后 Keys.ENTER 回车
web.find_element(By.XPATH, '//*[@id="search_input"]').send_keys('python', Keys.ENTER)
time.sleep(1)

li_list = web.find_elements(By.XPATH,'//*[@id="jobList"]/div[1]/div')
for li in li_list:
    job_name = li.find_element(By.XPATH,'./div[1]/div[1]/div[1]/a').text
    job_price = li.find_element(By.XPATH,'./div[1]/div[1]/div[2]/span').text
    company_nam = li.find_element(By.XPATH,'./div[1]/div[2]/div[1]/a').text
    print(job_name,job_price,company_nam)

web.close()


分享给朋友:

相关文章

如何为精简的 CSS 文件删除未使用的 CSS

如何为精简的 CSS 文件删除未使用的 CSS

精简的网站比臃肿的网站运行得更快,这已经不是什么秘密了。不要让不必要的 CSS 拖累您的 Web 项目;使用下面描述的工具和技术来帮助您删除未使用的 CSS 并提高您网站的整体性能。什么是未使用的 C...

python下elasticsearch简单接口操作

# -*- coding:utf-8 -*- # elasticsearch 默认算法bm25 from elasticsearch&n...

python下elasticsearch搜索接口封装实现

# -*- coding:utf-8 -*- from elasticsearch import Elasticsearch,Transp...

python下random随机选择的三种方式

from random import sample,choice,choices list_1 = [1,2,3,4,5,6] # 从列...

python切换当前工作目录

python脚本在运行的时候,如果牵涉到当前工作目录文件创建、读取,最好是提前切换到当前的工作目录下,因为在window环境下可能会正常执行,放到Linux环境下可能就会执行出错,就是因为这个没有切换...

宝塔计划任务运行python脚本

今天操作宝塔计划任务运行python脚本遇到一下几个问题,附上解决方案:一、centos 8.0一下的系统自带的是 python2.7的版本使用python3运行脚本的话1.安装python3版本2....

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。