博客
关于我
正则表达式匹配特定字母后面的数字
阅读量:341 次
发布时间:2019-03-04

本文共 270 字,大约阅读时间需要 1 分钟。

需求场景,爬虫数据提取。

  1. 通过text = request.get().text()得到目标网页的内容
  2. 通过text_html = BeautifulSoup(text)得到html形式
  3. 通过tag = text_html.find_all(label)[i]得到目标数据所在标签
  4. 通过NavigableString = tag.get_text()得到目标标签内的字符串内容
  5. 通过正则表达式匹配出特定字母后面的数据,就是想要的数据

本文遇到的是爬取链家二手房在售数目,最后得到这样一段字符串

在这里插入图片描述

所用正则表达式:count:\s\d{1,9}

转载地址:http://yxre.baihongyu.com/

你可能感兴趣的文章
Vue.js——v-model结合checkbox类型——2020.11.22
查看>>
Mybatis核心配置文件--常用标签详解
查看>>
R语言练习题答案(3)
查看>>
jQuery 事件及动画
查看>>
[电影]《Ladybird》演绎完整18岁的青春
查看>>
js中[]、{}、()的区别
查看>>
js-禁止右键菜单代码、禁止复制粘贴代码
查看>>
血色先锋队
查看>>
win10系统安装配置Go环境包(第0章)
查看>>
搭建samba服务器
查看>>
Java: 错误: 不支持发行版本 5
查看>>
顺序表的操作总结
查看>>
Java基础语法
查看>>
文本情感分类
查看>>
Python模块_os文件_目录方法
查看>>
部署kuboard3 管理工具
查看>>
SpringBoot中使用Mybatis访问MySQL数据库(使用xml方式)
查看>>
Algorithms Unlocked
查看>>
python中的map( )函数及lambda()函数简介
查看>>
SQL Sever 学习笔记三——聚合查询
查看>>