首页 > 软件开发 > ECLIPSE >

java获取页面中文后台显示乱码怎么解决

来源:互联网 2023-03-17 00:03:08 版权归原作者所有,如有侵权,请联系我们

java程序在抓取url页面时,经常会遇到中文输出乱码的问题。其主要原因是编码格式不匹配。当前大部分网页以utf8编码格式存储,而通过网络抓取页面时,将utf8作为字节流形式传输到本地,因此需要将字节流转换回utf8编码的文本。如果不转换,或者转换成其他编码格式,就会出现中文乱码。6VB办公区 - 实用经验教程分享!

方法/步骤

  • 1

    在浏览器中打开百度首页,右击【检查】,查看页面编码,确认为utf86VB办公区 - 实用经验教程分享!

    java获取页面中文后台显示乱码怎么解决6VB办公区 - 实用经验教程分享!

  • 2

    这里以eclipse作为开发工具,编写示例代码,抓取百度首页,并将其内容打印输出。这里先以gbk编码测试,输出结果为乱码。6VB办公区 - 实用经验教程分享!

    6VB办公区 - 实用经验教程分享!

    java获取页面中文后台显示乱码怎么解决6VB办公区 - 实用经验教程分享!

    java获取页面中文后台显示乱码怎么解决6VB办公区 - 实用经验教程分享!

  • 2
  • 3

    修改代码,使用utf编码格式, String data = new String(getData,"utf8");6VB办公区 - 实用经验教程分享!

    中文显示正常6VB办公区 - 实用经验教程分享!

    java获取页面中文后台显示乱码怎么解决6VB办公区 - 实用经验教程分享!

    java获取页面中文后台显示乱码怎么解决6VB办公区 - 实用经验教程分享!

  • 注意事项

    • eclipse的默认编码格式应尽量设置为utf8

    以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!6VB办公区 - 实用经验教程分享!


    标签: JAVAHTMLECLIPSE

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号