首页 > 软件开发 > JAVA >

Java 读取Word目录内容

来源:互联网 2023-03-16 19:10:53 212

Word中可根据对应文字的大纲级别来生成目录,读者通过目录内容可快速获取文档内容框架及结构,并且能够快速地定位到内容所在页面,方便阅读。在通过Java后端程序读取Word文档时,我们可以通过判定内容是否为目录域,来实现读取目录内容,本文,将以Java代码示例,展示如何实现该需求。Nc7办公区 - 实用经验教程分享!

工具/原料

  • IntelliJ IDEA
  • Word文档
  • Free Spire.Doc for Java

导入jar

  • 1

    将Word库下载到本地,并解压,找到lib文件夹下的jar文件。然后在IDEA程序中打开“Project Structure”,执行如图步骤:Nc7办公区 - 实用经验教程分享!

    Java 读取Word目录内容Nc7办公区 - 实用经验教程分享!

  • 2

    找到本地路径下的jar文件,点击“OK”,添加到列表:Nc7办公区 - 实用经验教程分享!

    Java 读取Word目录内容Nc7办公区 - 实用经验教程分享!

  • 3

    勾选选项,点击“Apply”,然后等待程序安装导入jar:Nc7办公区 - 实用经验教程分享!

    Java 读取Word目录内容Nc7办公区 - 实用经验教程分享!

  • 4

    完成jar导入后,编辑如下Java代码:Nc7办公区 - 实用经验教程分享!

    import com.spire.doc.Document;

    Nc7办公区 - 实用经验教程分享!

    import com.spire.doc.Section;

    Nc7办公区 - 实用经验教程分享!

    import com.spire.doc.documents.Paragraph;

    Nc7办公区 - 实用经验教程分享!

    Nc7办公区 - 实用经验教程分享!

    import java.io.BufferedWriter;

    Nc7办公区 - 实用经验教程分享!

    import java.io.File;

    Nc7办公区 - 实用经验教程分享!

    import java.io.FileWriter;

    Nc7办公区 - 实用经验教程分享!

    import java.io.IOException;

    Nc7办公区 - 实用经验教程分享!

    Nc7办公区 - 实用经验教程分享!

    public class GetTOC {

    Nc7办公区 - 实用经验教程分享!

    public static void main(String[] args) throws IOException {

    Nc7办公区 - 实用经验教程分享!

    //加载包含目录的Word文档

    Nc7办公区 - 实用经验教程分享!

    Document doc = new Document();

    Nc7办公区 - 实用经验教程分享!

    doc.loadFromFile("目录2.docx");

    Nc7办公区 - 实用经验教程分享!

    Nc7办公区 - 实用经验教程分享!

    //获取第一节

    Nc7办公区 - 实用经验教程分享!

    Section section = doc.getSections().get(0);

    Nc7办公区 - 实用经验教程分享!

    Nc7办公区 - 实用经验教程分享!

    //保存目录内容到.txt文档

    Nc7办公区 - 实用经验教程分享!

    File file = new File("GetToc.txt");

    Nc7办公区 - 实用经验教程分享!

    if (file.exists())

    Nc7办公区 - 实用经验教程分享!

    {

    Nc7办公区 - 实用经验教程分享!

    file.delete();

    Nc7办公区 - 实用经验教程分享!

    }

    Nc7办公区 - 实用经验教程分享!

    file.createNewFile();

    Nc7办公区 - 实用经验教程分享!

    FileWriter fw = new FileWriter(file, true);

    Nc7办公区 - 实用经验教程分享!

    BufferedWriter bw = new BufferedWriter(fw);

    Nc7办公区 - 实用经验教程分享!

    Nc7办公区 - 实用经验教程分享!

    //遍历第一节中的所有段落

    Nc7办公区 - 实用经验教程分享!

    for (int i = 0; i section.getParagraphs().getCount(); i )

    Nc7办公区 - 实用经验教程分享!

    {

    Nc7办公区 - 实用经验教程分享!

    Paragraph paragraph = section.getParagraphs().get(i);

    Nc7办公区 - 实用经验教程分享!

    //判断段落是否为目录

    Nc7办公区 - 实用经验教程分享!

    if (paragraph.getStyleName().matches("TOC\\w "))

    Nc7办公区 - 实用经验教程分享!

    {

    Nc7办公区 - 实用经验教程分享!

    //获取目录中的文本内容

    Nc7办公区 - 实用经验教程分享!

    String text = paragraph.getText();

    Nc7办公区 - 实用经验教程分享!

    //写入txt文档

    Nc7办公区 - 实用经验教程分享!

    bw.write( text "\r");

    Nc7办公区 - 实用经验教程分享!

    }

    Nc7办公区 - 实用经验教程分享!

    bw.write("\n");

    Nc7办公区 - 实用经验教程分享!

    }

    Nc7办公区 - 实用经验教程分享!

    Nc7办公区 - 实用经验教程分享!

    bw.flush();

    Nc7办公区 - 实用经验教程分享!

    bw.close();

    Nc7办公区 - 实用经验教程分享!

    fw.close();

    Nc7办公区 - 实用经验教程分享!

    }

    Nc7办公区 - 实用经验教程分享!

    }Nc7办公区 - 实用经验教程分享!

  • 5

    执行代码,读取目录,生成txt文档,如图效果:Nc7办公区 - 实用经验教程分享!

    Java 读取Word目录内容Nc7办公区 - 实用经验教程分享!

  • 以上方法由办公区教程网编辑摘抄自百度经验可供大家参考!Nc7办公区 - 实用经验教程分享!


    标签: WordJAVA

    办公区 Copyright © 2016-2023 www.bgqu.net. Some Rights Reserved. 备案号:湘ICP备2020019561号统计代码