首页 > 软件开发 > PYTHON >

python怎么用BeautifulSoup找到我们需要的数据

来源:互联网 2023-03-16 19:18:06 472

python怎么用BeautifulSoup找到我们需要的数据,这个BeautifulSoup我用了两天时间学会,第一天懵逼状态,第二天一个突破,整个获取方式就变的很简单了CLQ办公区 - 实用经验教程分享!

python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

方法/步骤

  • 1

    首先我们来看一下BeautifulSoup的使用方式CLQ办公区 - 实用经验教程分享!

    要解析的内容是字符串,也就是网页的源代码CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 2

    而获取的解析结果,我可以用find()的方式来查看,这个是查找首个满足条件的CLQ办公区 - 实用经验教程分享!

    而find_all()是返回所有满足条件的,CLQ办公区 - 实用经验教程分享!

    而tag一般是你第一次用find后获得的数据就是tagCLQ办公区 - 实用经验教程分享!

    这个tag你可以直接不管,你可以当做他是另外一个BeautifulSoup解析后的结果CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 2本页面未经许可获取自百度经验
  • 3

    find的使用方式,下面用一个小例子来说明一下CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 4

    soup = BeautifulSoup(res.text,'html.parser')

    CLQ办公区 - 实用经验教程分享!

    items = soup.find_all('div')

    CLQ办公区 - 实用经验教程分享!

    print(items)CLQ办公区 - 实用经验教程分享!

    这段返回的结果是这样的,上面的意思就是在BeautifulSoup解析后的结果,解析后是网页的源代码,在源代码里面找到全部div的标签,然后返回CLQ办公区 - 实用经验教程分享!

    注意返回的是一个列表,是由tag组成的列表CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 5

    上面我们也可以理解成,我的电脑里面找到某类文件群,这个结果当做一个tag的集合,而tag也可以用find的方式来再来细分,但特别注意,一群tag用不了find,需要你先单独拿出来才行CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 6

    所以我们可用for遍历取出,然后在这个基础上用find进一步找到我们需要的文件夹,找文件夹中还可以在利用find查找,直接找到我们需要的内容并返回CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 7

    而返回数据结果一般用到的是tag的CLQ办公区 - 实用经验教程分享!

    tag.text返回源代码中的文本CLQ办公区 - 实用经验教程分享!

    tag['属性值']CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 8

    如图,我们标注了两个地方,用上面的find找到最后一层后,用tag.text返回该层的文本,文本是在两个>之间的文本CLQ办公区 - 实用经验教程分享!

    >文本>CLQ办公区 - 实用经验教程分享!

    而属性值是size='1'中的值,也就是1CLQ办公区 - 实用经验教程分享!

    输入方式是tag['size']这样他返回的就是1CLQ办公区 - 实用经验教程分享!

    python怎么用BeautifulSoup找到我们需要的数据CLQ办公区 - 实用经验教程分享!

  • 注意事项

    • 在使用find_all获得的是列表,而列表进行用find进行下一步查看,所以需要用for分开
    • find的查看方式是用标签和属性值搭配搜索,所以需要简单理解一下HTML

    以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!CLQ办公区 - 实用经验教程分享!


    标签: python数据

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号统计代码