博客
关于我
正则表达式匹配特定字母后面的数字
阅读量:341 次
发布时间:2019-03-04

本文共 270 字,大约阅读时间需要 1 分钟。

需求场景,爬虫数据提取。

  1. 通过text = request.get().text()得到目标网页的内容
  2. 通过text_html = BeautifulSoup(text)得到html形式
  3. 通过tag = text_html.find_all(label)[i]得到目标数据所在标签
  4. 通过NavigableString = tag.get_text()得到目标标签内的字符串内容
  5. 通过正则表达式匹配出特定字母后面的数据,就是想要的数据

本文遇到的是爬取链家二手房在售数目,最后得到这样一段字符串

在这里插入图片描述

所用正则表达式:count:\s\d{1,9}

转载地址:http://yxre.baihongyu.com/

你可能感兴趣的文章
Android Studio Error—Gradle: 错误:编码 GBK 的不可映射字符的
查看>>
【30】kotlin 闭包
查看>>
【46】kotlin 集合框架
查看>>
【47】kotlin IO操作
查看>>
【55】Kotlin android Anko 神兵利器2
查看>>
swift GCD 基本操作
查看>>
快速批量删除Jenkins构建清理磁盘空间并按参数保留最近构建
查看>>
Xcode10 Multiple commands produce
查看>>
html 选择文件显示文件名称
查看>>
python PIL 压缩图片
查看>>
解决Android中WebView跳转到浏览器的问题
查看>>