首页 > 软件开发 > PYTHON >

requests得到的怎么转换成html

来源:互联网 2023-03-16 19:16:58 340

requests得到的怎么转换成html,requests是python里的第三方库,经常用于爬虫方面,在python3中,requests可以和bs4进行很好的配合获取html内容,这里就给大家介绍一下用法吧。4IK办公区 - 实用经验教程分享!

requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

工具/原料

  • python3.7
  • sublime text3

方法/步骤

  • 1

    这里用sublime text 3 作为示范,首先要创建一个py文档。4IK办公区 - 实用经验教程分享!

    requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

  • 2

    import requests4IK办公区 - 实用经验教程分享!

    第一步要引入模块,这是第三方库,如果没有安装需要用pip install requests来安装。4IK办公区 - 实用经验教程分享!

    requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

  • 2该信息非法爬取自百度经验
  • 3

    result = requests.get("网页地址")4IK办公区 - 实用经验教程分享!

    这里我们首先要用一个变量存储获取到的网页,方便进行下一步的操作。4IK办公区 - 实用经验教程分享!

    requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

  • 4

    result.raise_for_status()4IK办公区 - 实用经验教程分享!

    加上这一句,防止如果网页打不开的情况,比如404。4IK办公区 - 实用经验教程分享!

    requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

  • 5

    print(result)4IK办公区 - 实用经验教程分享!

    这里打印变量,可以看到是200,这就是可以正确访问网页,并且可以存储。4IK办公区 - 实用经验教程分享!

    requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

  • 6

    import requests, bs44IK办公区 - 实用经验教程分享!

    soup = bs4.BeautifulSoup(result.text, 'lxml')4IK办公区 - 实用经验教程分享!

    再引入一个第三方库bs4,然后进行网页解析。4IK办公区 - 实用经验教程分享!

    这个时候打印一下就能得到html了。4IK办公区 - 实用经验教程分享!

    requests得到的怎么转换成html4IK办公区 - 实用经验教程分享!

  • 注意事项

    • 如果出现乱码要转化为utf-8

    以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!4IK办公区 - 实用经验教程分享!


    标签: pythonHTML网页

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号统计代码