首页 > 软件开发 > HTML >

Python3 如何解码编码html中的"等字符

来源:互联网 2023-03-16 19:11:41 95

介绍Python3处理html文档中编码的字符(比如escape过的引号是&quot)的办法,如何解码和编码。sCX办公区 - 实用经验教程分享!

Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

工具/原料

  • Python 3.6

方法/步骤

  • 1

    首先,如图是从html文档中截取的片段,可以看到其中有很多html转义编码的字符,比如引号变为&quot。sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

  • 2

    要解码这种字符串,一种旧方法是import cgi,使用cgi的escape()函数,但是该方法现在已经废弃。sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

  • 2本页面未经许可获取自百度经验
  • 3

    现在推荐的做法是使用html模块。首先import html,引用这个模块。sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

  • 4

    使用html的成员函数escape(),可以将一段正常带有符号的文本转义为html里的文本。sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

  • 5

    使用html的unescape函数,可以将带有html转义的字符串还原为原来的字符串。sCX办公区 - 实用经验教程分享!

    Python3 如何解码编码html中的&quot等字符sCX办公区 - 实用经验教程分享!

  • 注意事项

    • 这是html转义序列,还有url转义%开头,unicode转义\u开头。

    以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!sCX办公区 - 实用经验教程分享!


    标签: HTMLpython

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号统计代码