开源的读写word库

怎么用COM读写WORD里的文本信息？

1.你说的这个主要是取得word接口然后配合word自带的宏完成任务实现起来很简单COleVariant vTrue((short)TRUE), vFalse((short)FALSE),vOpt((long)DISP_E_PARAMNOTFOUND, VT_ERROR);_Application m_App；//定义Word提供的应用程序对象；Documents m_Docs；//定义Word提供的文档对象；Selection m_Sel；//定义Word提供的选择对象；m_Docs.ReleaseDispatch();m_Sel.ReleaseDispatch();m_App.m_bAutoRelease=true;if(!m_App.CreateDispatch(＂Word.Application＂)){ AfxMessageBox（＂创建WordXP服务失败！＂）； exit(1); }//下面是定义VARIANT变量；COleVariant varFilePath(sPath+＂MYDOC.DOC＂);COleVariant varstrNull(＂＂);COleVariant varZero((short)0);COleVariant varTrue(short(1),VT_BOOL);COleVariant varFalse(short(0),VT_BOOL);m_Docs.AttachDispatch(m_App.GetDocuments（)）；//将Documents类对象m_Docs和Idispatch接口关联起来；m_Docs.Open(varFilePath,varFalse,varFalse,varFalse,varstrNull,varstrNull,varFalse,varstrNull,varstrNull,varTrue,varTrue,varTrue,varTrue,varTrue,varTrue);//打开Word文档； m_Sel.AttachDispatch(m_App.GetSelection（)）；//将Selection类对象m_Sel和Idispatch接口关联起来；下面就是操作了~2.用批处理做不到如果只是这样子的话连VC都可以省了 VBS 就能做到比如新建一个c:\1.doc 里面写上wangtk1982 然后保存退出编辑下面文件为vbs文件运行看看结果Dim oWordSet oWord = WScript.CreateObject(＂Word.Application＂)set myDoc =oWord.Documents.Open(＂c:\1.doc＂)With oWord.Selection.Find.Text = ＂1982＂.Replacement.Text = ＂2011＂.Forward = True.Wrap = wdFindContinue.Format = False.MatchCase = False.MatchWholeWord = False.MatchByte = True.MatchWildcards = False.MatchSoundsLike = False.MatchAllWordForms = FalseEnd WithoWord.Selection.Find.Execute ,,,,,,,,,,1myDOc.SavemyDoc.Closeoword.Quit

安卓开发如何读取word文档显示出来？

Apache POI可以满足你的需求，我觉估计也是唯一靠谱的选择了。

是一个开源的解析Office文件的Java库。

我以前用它来给单位的内容管理客户端做过Word文档展示。

总的来说，POI库就是把各种Office文件解析成一种文档树。

当时我是修改了一下POI的一个例子程序把word转成html文件来显示的。

有很多支持的包，我用的是poi包，注意版本，要和excel版本相符。

然后网上有例子，直接可以拿到数据，怎么显示出来就简单了。

Java中如何用I/O流读取一个Word文档的内容

1. 通过流来读取，例如：TextFileForm fileForm = (TextFileForm) form; FormFile formFile = fileForm.getTxtFile(); if (formFile.getFileData().length == 0) { response.setCharacterEncoding(＂gb2312＂); response.getWriter().write(＂＂); } InputStream in = formFile.getInputStream(); WordExtractor extractor = new WordExtractor(); String str = extractor.extractText(in);这段代码就是负责读取word的

有什么好的开源的第三方word组件

word的文件编码格式应该不是公开的，如果你想通过程序写入到word文件，那么必须知道它的编码方式。

网上有一个开源软件叫open office，你可以下载它的源码看看它是怎样对word文件编码解码的。

如果不想采取上述方法，你可以找找有没有别人提供的闭源库，比如dll动态链接库之类的。

总之，你想写入word文档，必须要能编码解码，这是核心问题

Python 常用的标准库以及第三方库有哪些

展开全部 Python常用库大全，看看有没有你需要的。

环境管理管理 Python 版本和环境的工具p – 非常简单的交互式 python 版本管理工具。

pyenv – 简单的 Python 版本管理工具。

Vex – 可以在虚拟环境中执行命令。

virtualenv – 创建独立 Python 环境的工具。

virtualenvwrapper- virtualenv 的一组扩展。

包管理管理包和依赖的工具。

pip – Python 包和依赖关系管理工具。

pip-tools – 保证 Python 包依赖关系更新的一组工具。

conda – 跨平台，Python 二进制包管理工具。

Curdling – 管理 Python 包的命令行工具。

wheel – Python 分发的新标准，意在取代 eggs。

包仓库本地 PyPI 仓库服务和代理。

warehouse – 下一代 PyPI。

Warehousebandersnatch – PyPA 提供的 PyPI 镜像工具。

devpi – PyPI 服务和打包/测试/分发工具。

localshop – 本地 PyPI 服务（自定义包并且自动对 PyPI 镜像）。

分发打包为可执行文件以便分发。

PyInstaller – 将 Python 程序转换成独立的执行文件（跨平台）。

dh-virtualenv – 构建并将 virtualenv 虚拟环境作为一个 Debian 包来发布。

Nuitka – 将脚本、模块、包编译成可执行文件或扩展模块。

py2app – 将 Python 脚本变为独立软件包（Mac OS X）。

py2exe – 将 Python 脚本变为独立软件包（Windows）。

pynsist – 一个用来创建 Windows 安装程序的工具，可以在安装程序中打包 Python本身。

构建工具将源码编译成软件。

buildout – 一个构建系统，从多个组件来创建，组装和部署应用。

BitBake – 针对嵌入式 Linux 的类似 make 的构建工具。

fabricate – 对任何语言自动找到依赖关系的构建工具。

PlatformIO – 多平台命令行构建工具。

PyBuilder – 纯 Python 实现的持续化构建工具。

SCons – 软件构建工具。

交互式解析器交互式 Python 解析器。

IPython – 功能丰富的工具，非常有效的使用交互式 Python。

bpython- 界面丰富的 Python 解析器。

ptpython – 高级交互式Python解析器，构建于python-prompt-toolkit 之上。

文件文件管理和 MIME（多用途的网际邮件扩充协议）类型检测。

imghdr – （Python 标准库）检测图片类型。

mimetypes – （Python 标准库）将文件名映射为 MIME 类型。

path.py – 对 os.path 进行封装的模块。

pathlib – （Python3.4+ 标准库）跨平台的、面向对象的路径操作库。

python-magic- 文件类型检测的第三方库 libmagic 的 Python 接口。

Unipath- 用面向对象的方式操作文件和目录 watchdog – 管理文件系统事件的 API 和 shell 工具日期和时间操作日期和时间的类库。

arrow- 更好的 Python 日期时间操作类库。

Chronyk – Python 3 的类库，用于解析手写格式的时间和日期。

dateutil – Python datetime 模块的扩展。

delorean- 解决 Python 中有关日期处理的棘手问题的库。

moment – 一个用来处理时间和日期的Python库。

灵感来自于Moment.js。

PyTime – 一个简单易用的Python模块，用于通过字符串来操作日期/时间。

pytz – 现代以及历史版本的世界时区定义。

将时区数据库引入Python。

when.py – 提供用户友好的函数来帮助用户进行常用的日期和时间操作。

文本处理用于解析和操作文本的库。

通用 chardet – 字符编码检测器，兼容 Python2 和 Python3。

difflib – （Python 标准库）帮助我们进行差异化比较。

ftfy – 让Unicode文本更完整更连贯。

fuzzywuzzy – 模糊字符串匹配。

Levenshtein – 快速计算编辑距离以及字符串的相似度。

pangu.py – 在中日韩语字符和数字字母之间添加空格。

pyfiglet -figlet 的 Python实现。

shortuuid – 一个生成器库，用以生成简洁的，明白的，URL 安全的 UUID。

unidecode – Unicode 文本的 ASCII 转换形式。

uniout – 打印可读的字符，而不是转义的字符串。

xpinyin – 一个用于把汉字转换为拼音的库。

Slug化 awesome-slugify – 一个 Python slug 化库，可以保持 Unicode。

python-slugify – Python slug 化库，可以把 unicode 转化为 ASCII。

unicode-slugify – 一个 slug 工具，可以生成 unicode slugs ，需要依赖 Django 。

解析器 phonenumbers – 解析，格式化，储存，验证电话号码。

PLY – lex 和 yacc 解析工具的 Python 实现。

Pygments – 通用语法高亮工具。

pyparsing – 生成通用解析器的框架。

python-nameparser – 把一个人名分解为几个独立的部分。

python-user-agents – 浏览器 user agent 解析器。

sqlparse – 一个无验证的 SQL 解析器。

特殊文本格式处理一些用来解析和操作特殊文本格式的库。

通用 tablib – 一个用来处理中表格数据的模块。

Office Marmir – 把输入的Python 数据结构转换为电子表单。

openpyxl – 一个用来读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件的库。

python-docx – 读取，查询以及修改 Microsoft Word 2007/2008 docx 文件。

unoconv – 在 LibreOffice/OpenOffice 支持的任意文件格式之间进行转换。

XlsxWriter – 一个用于创建 Excel .xlsx 文件的 Python 模块。

xlwings – 一个使得在 Excel 中方便调用 Python 的库（反之亦然），基于 BSD 协议。

xlwt / xlrd – 读写 Excel 文件的数据和格式信息。

relatorio – 模板化OpenDocument 文件。

PDF PDFMiner – 一个用于从PDF文档中抽取信息的工具。

PyPDF2 – 一个可以分割，合并...

java进行word文档的开发一般使用什么技术

展开全部 java读取word文档时，虽然网上介绍了很多插件poi、java2Word、jacob、itext等等，poi无法读取格式（新的API估计行好像还在处于研发阶段，不太稳定，做项目不太敢用）；java2Word、jacob容易报错找不到注册，比较诡异，我曾经在不同的机器上试过，操作方法完全一致，有的机器不报错，有的报错，去他们论坛找高人解决也说不出原因，项目部署用它有点玄；itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。

经过一番选择还是折中点采用rtf最好，毕竟rtf是开源格式，不需要借助任何插件，只需基本IO操作外加编码转换即可。

rtf格式文件表面看来和doc没啥区别，都可以用word打开，各种格式都可以设定。

...

java操作word 的有哪几种方式

java读取word文档时，虽然网上介绍了很多插件poi、java2Word、jacob、itext等等，poi无法读取格式（新的API估计行好像还在处于研发阶段，不太稳定，做项目不太敢用）；java2Word、jacob容易报错找不到注册，比较诡异，我曾经在不同的机器上试过，操作方法完全一致，有的机器不报错，有的报错，去他们论坛找高人解决也说不出原因，项目部署用它有点玄；itxt好像写很方便但是我查了好久资料没有见到过关于读的好办法。

经过一番选择还是折中点采用rtf最好，毕竟rtf是开源格式，不需要借助任何插件，只需基本IO操作外加编码转换即可。

rtf格式文件表面看来和doc没啥区别，都可以用word打开，各种格式都可以设定。

----- 实现的功能：读取rtf模板内容（格式和文本内容），替换变化部分，形成新的rtf文档。

----- 实现思路：模板中固定部分手动输入，变化的部分用$info$表示，只需替换$info$即可。

1、采用字节的形式读取rtf模板内容2、将可变的内容字符串转为rtf编码3、替换原文中的可变部分，形成新的rtf文档主要程序如下：public String bin2hex(String bin) {char[] digital = ＂0123456789ABCDEF＂.toCharArray();StringBuffer sb = new StringBuffer(＂＂);byte[] bs = bin.getBytes();int bit;for (int i = 0; i > 4;sb.append(＂\\'＂);sb.append(digital[bit]);bit = bs[i] & 0x0f;sb.append(digital[bit]);}return sb.toString(); }public String readByteRtf(InputStream ins, String path){ String sourcecontent =＂＂; try{ ins = newFileInputStream(path); byte[] b= new byte[1024];if (ins == null) {System.out.println（＂源模板文件不存在＂）；}int bytesRead = 0;while (true) {bytesRead = ins.read(b, 0, 1024); // return final read bytescountsif(bytesRead == -1) {// end of InputStreamSystem.out.println（＂读取模板文件结束＂）；break;}sourcecontent += new String(b, 0, bytesRead); // convert to stringusing bytes} }catch(Exception e){ e.printStackTrace(); }

java解析word文档用什么技术

经过一番选择还是折中点采用rtf最好，毕竟rtf是开源格式，不需要借助任何插件，只需基本IO操作外加编码转换即可。

rtf格式文件表面看来和doc没啥区别，都可以用word打开，各种格式都可以设定。

如何使用apache poi将word转化为html

Java可以使用这个开源框架，对word进行读取合并等操作，Apache POI是一个开源的利用Java读写Excel、WORD等微软OLE2组件文档的项目。

最新的3.5版本有很多改进，加入了对采用OOXML格式的Office 2007支持，如xlsx、docx、pptx文档。

示例如下：import org.apache.poi.POITextExtractor; import org.apache.poi.hwpf.extractor.WordExtractor; //得到.doc文件提取器 org.apache.poi.hwpf.extractor.WordExtractor doc = new WordExtractor(new FileInputStream(filePath)); //提取.doc正文文本 String text = doc.getText(); //提取.doc批注 String[] comments = doc. getCommentsText(); 2007 import org.apache.poi.POITextExtractor; import org.apache.poi.xwpf.extractor.XWPFWordExtractor; import org.apache.poi.xwpf.usermodel.XWPFComment; import org.apache.poi.xwpf.usermodel.XWPFDocument; //得到.docx文件提取器 org.apache.poi.xwpf.extractor.XWPFWordExtractor docx = new XWPFWordExtractor(POIXMLDocument.openPackage(filePath)); //提取.docx正文文本 String text = docx.getText(); //提取.docx批注 org.apache.poi.xwpf.usermodel.XWPFComment[] comments = docx.getDocument()).getComments(); for(XWPFComment comment:comments){ comment.getId（)；//提取批注Id comment.getAuthor（)；//提取批注修改人 comment.getText（)；//提取批注内容 }

转载请注明出处51数据库 » 开源的读写word库