从docx文件中提取文本
1、将“.docx”文件后缀改成“.zip”,用解压缩软件打开这个压缩包。
2、压缩包里面有几个文件夹:“word”文件夹里面的“document.xml”文件保存文本内容(可以直接用记事本打开);“media”文件夹下存放文档中的图片。
3、也可以通过DOCX2TXT工具直接提取文本(源文件须未加密)。
- 原文作者:boxwang
- 原文链接:https://www.ifshow.com/extract-text-from-the-docx-file/
- 版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可,非商业转载请注明出处(作者,原文链接),商业转载请联系作者获得授权。如果特别注明为转载文章,请联系其原始作者。