xml格式如何转换成doc格式文件
通过jodconveter来实现转化(http://www.artofsolving.com/opensource/jodconverter)。
这种方式实现起来比较麻烦,操作有点繁琐,但是能解决上述问题。
通过启动OpenOffice.org的服务端口,实现程序操作opeanoffice实现文件的转换。
贴上代码:mport java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.InputStream; import java.io.OutputStream; import com.artofsolving.jodconverter.DefaultDocumentFormatRegistry; import com.artofsolving.jodconverter.DocumentConverter; import com.artofsolving.jodconverter.DocumentFormatRegistry; import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection; import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection; import com.artofsolving.jodconverter.openoffice.converter.OpenOfficeDocumentConverter; public class test { /** * @param args */ public static void main(String[] args) throws Exception { // TODO Auto-generated method stub test t = new test(); //File in = new File("d:\\mytest\\test1.pdf"); //File out = new File("d:\\mytest\\test11.html"); FileInputStream input = new FileInputStream("d:\\mytest\\test11.pdf"); FileOutputStream output = new FileOutputStream("d:\\mytest\\test11.doc"); t.convert(input, output); } public void convert(File input, File output) throws Exception { OpenOfficeConnection conn = new SocketOpenOfficeConnection("localhost", 8100); conn.connect(); DocumentConverter converter = new OpenOfficeDocumentConverter(conn); converter.convert(input, output); conn.disconnect(); } public void convert(InputStream input, OutputStream output) throws Exception { OpenOfficeConnection conn = new SocketOpenOfficeConnection("localhost", 8100); conn.connect(); DocumentConverter converter = new OpenOfficeDocumentConverter(conn); DocumentFormatRegistry registry = new DefaultDocumentFormatRegistry(); converter.convert(input, registry.getFormatByFileExtension("pdf"), output, registry.getFormatByFileExtension("doc")); conn.disconnect(); } }Office Open XML 文件格式简介随着20世纪90年代XML的出现,企业计算客户开始逐渐认识到,在他们所依赖的计算机产品和应用中采用开放的格式和标准所带来的商业价值。
IT专业人员将从通用的数据格式中受益匪浅,这种格式可能是XML,因为它拥有被应用程序、平台和Internet浏览器读取的能力。
同样,随着在Microsoft Office 2000中对于XML格式的支持与采用,开发人员开始认识到,他们需要将以前的Microsoft Office版本中的二进制文件格式转换为XML格式。
二进制文件(.doc,.dot,.xls,以及.ppt文件)在过去几年中一直肩负着存储和转换数据的重任,而现在它们无法满足新的市场需求的挑战,其中包括轻松地在异构应用之间传递数据,以及允许用户从这些数据中搜集商业信息。
2007 Microsoft Office system为Microsoft Office Excel 2007,Microsoft Office Word 2007,和Microsoft Office PowerPoint 2007采用了基于XML的文件格式,从而延续了这种转移。
新的文件格式,称为Office Open XML格式,解决了上述市场需求的问题,同时改变了您基于Microsoft Office文档建立解决方案的方式。
新的格式增强了文件与数据的管理能力,数据恢复能力,以及与业务线系统的互操作能力。
它们是对早期版本的二进制文件的扩展。
任何支持XML的应用程序都可以访问新文件格式当中的数据,并与之协同工作。
这些应用程序并不需要成为Microsoft Office system或Microsoft产品的一部分。
用户也可以使用标准的转换来提取或重新组织数据。
另外,有关安全性的担忧也大大的降低,因为信息是存储在XML当中的,它从本质上来讲都是纯文本的。
因此,数据可以没有任何障碍地通过企业防火墙进行传递。
怎么将XML文档转成WORD文档
工具:word方法:1. 打开word,点击新建2. 点击本机上的模板3. 选择棋牌向导4. 勾选“将其他文件格式转换为word文档格式”并选择XML文档确定即可
java读取带格式word内容
// 表格类型ListtableList = doc.getTables();for (int i = 0; i System.out.println(i);XWPFTable table = tableList.get(i);System.out.println(table.getText());}获取表格中内容可以用这个,但是你说的格式是什么意思,每个字的字体之类的吗?
用java如何把一个txt文档转换成具有规定格式的Word文档
实现思路:直接从Excel文件装换成XML文件是可以实现的,这里我采用一个中间装换,也就是先实现excel文件内容放入实现设计好的access数据库文件中,然后再从access中读取记录写道xml文件中,因为我这里的实际问题是把多个excel表,每个表中又有多个sheet工作薄,这样我先导入数据库中,也方便修改和处理.这样,需要写两个类:XlsToAccess类,用来实现从excel文件根据事先约定的格式,按照数据库设计字段存放进去AccessToXml类,用来实现从access文件数据库中的记录按约定格式写到xml文件中去然后还需要一个主运行窗口类XlsToXml,这个类我们使用eclipse插件SWT Designer来完成最后把工程打成JAR包,再用NativeJ将Jar包生成为可执行的exe文件
JAVA如何修改Word文档格式
展开全部 如果只是文字的话,直接读出来,然后用07的存回去,poi能实现。
但是有目录什么的就麻烦了,03的读出来目录是一行代码,就容易出问题我用的poi正好在纠结,最后没办法,用按键精灵一个个转的。
有个word文档批处理软件貌似能做到,但是要收费。
下面的是我读取word文字的代码03读取:InputStream is = new FileInputStream(docfile);WordExtractor ex = new WordExtractor(is);text = ex.getText();System.out.println(text);07读取:OPCPackage opcPackage = POIXMLDocument.openPackage(docxfile.getAbsolutePath()); POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage); text = extractor.getText(); System.out.println(text);最后:doc不一定是03的,也可能是07的...
如何将word转化为XML格式的文件
将word转化为XML格式的文件在保存时,将文件类型选择为XML即可。
软件工具:word 20131、打开该word文档,点击菜单栏上的“文件”。
2、点击另存为 ,选择保存位置。
3、在保存类型中点击选择“word xml文件”。
如果要使低版本可以打开的则选择word 2003 xml,然后点击保存即可。
java中如何生成word文档的目录页
1.创建带有格式的word文档,将该需要动态展示的数据使用变量符替换。
2. 将刚刚创建的word文档另存为xml格式。
3.编辑这个XMl文档去掉多余的xml标记,如图中蓝色部分 4.从Freemarker官网【下载】最新的开发包,将freemarker.jar拷贝到自己的开发项目中。
5.新建DocUtil类,实现根据Doc模板生成word文件的方法 6.用户根据自己的需要,调用使用getDataMap获取需要传递的变量,然后调用createDoc方法生成所需要的文档。
用java怎么把html文本转换成xml文本输出
展开全部 java中利用HtmlAgilityPack API就可以把html解析成xml了。
在HtmlAgilityPack中常用到的类有HtmlDocument、HtmlNodeCollection、HtmlNode和HtmlWeb等。
其流程一般是先获取HTML,这个可以通过HtmlDocument的Load()或LoadHtml()来加载静态内容,或者也可以HtmlWeb的Get()或Load()方法来加载网络上的URL对应的HTML。
得到了HtmlDocument的实例之后,就可以用HtmlDocument的DocumentNode属性,这是整个HTML文档的根节点,它本身也是一个HtmlNode,然后就可以利用HtmlNode的SelectNodes()方法返回多个HtmlNode的集合对象HtmlNodeCollection,也可以利用HtmlNode的SelectSingleNode()方法返回单个HtmlNode。
...
freemaker通过word转换成XML模板,再通过XML模板导出Word
Aspose.PDF不能将word文件转换成PDF文件,因此就会出现aspose把word文档转换为pdf文档时出现乱码情况。
aspose的官网上查了下文档,Aspose.PDF无法直接转换word文档,需要先有个中间步骤。
就是先把word转换成XML格式的文件,再使用Aspose.PDF绑定这个XML,再保存为PDF格式。
如果word文档中有图片,则生成XML的时候会在临时文件夹中生成图片。
转载请注明出处51数据库 » java xml转成word文档格式