C#怎样将word转换成HTML源码
C#实现的word转html命令行工具,对情况进行了解和思考后,认为可以通过一个中间程序自动化的将word文档转换成为excel,遂决定写个程序来实现这个转换环节。
对于这种纯Windows的需求,估计也就是JAVA或者是VS系列语言更加方便一些。
最近的项目使用的语言主要是JAVA、VC++,C#还没有尝试过完成实际项目,于是打算用C#尝试实现一下。
http://blog.csdn.net/solomonlangrui/article/details/47168449
java程序怎么读取html网页
/** 获取所指向url的输出流(指所有内容) * @urlString url路径 如:http://www.baidu.com*返回的String 则为html代码* */private String getHtml(String urlString) { try {StringBuffer html = new StringBuffer(); java.net.URL url = new java.net.URL(urlString); //根据 String 表示形式创建 URL 对象。
java.net.HttpURLConnection conn = (java.net.HttpURLConnection) url.openConnection();// 返回一个 URLConnection 对象,它表示到 URL 所引用的远程对象的连接。
java.io.InputStreamReader isr = new java.io.InputStreamReader(conn.getInputStream());//返回从此打开的连接读取的输入流。
java.io.BufferedReader br = new java.io.BufferedReader(isr);//创建一个使用默认大小输入缓冲区的缓冲字符输入流。
String temp;while ((temp = br.readLine()) != null) { //按行读取输出流if(!temp.trim().equals("")){html.append(temp).append("\n"); //读完每行后换行}}br.close(); //关闭isr.close(); //关闭return html.toString(); //返回此序列中数据的字符串表示形式。
} catch (Exception e) {e.printStackTrace();return null;}}
word中怎样插入html代码?
域是WORD中的一种特殊命令,它由花括号、域名(域代码)及选项开关构成。
域代码类似于公式,域选项并关是特殊指令,在域中可触发特定的操作。
在用WORD处理文档时若能巧妙应用域,会给我们的工作带来极大的方便。
特别是制作理科等试卷时,有着公式编辑器不可替代的优点。
一、更新域操作当WORD文档中的域没有显示出最新信息时,用户应采取以下措施进行更新,以获得新域结果。
1、更新单个域:首先单击需要更新的域或域结果,然后按下F9键。
2、更新一篇文档中所有域:执行“编辑”菜单中的“全选”命令,选定整篇文档,然后按下F9键。
另外,用户也可以执行“工具”菜单中的“选项”命令,并单击“打印”选项卡,然后选中“更新域”复选框,以实现WORD在每次打印前都自动更新文档中所有域的目的。
二、显示或隐藏域代码1、显示或者隐藏指定的域代码:首先单击需要实现域代码的域或其结果,然后按下“SHIFT+F9”组合键。
2、显示或者隐藏文档中所有域代码:按下“ALT+F9”组合键。
三、锁定/解除域操作1、要锁定某个域,以防止修改当前的域结果的方法是:单击此域,然后按下“CTRL+F11”组合键。
2、要解除锁定,以便对域进行更改的方法是:单击此域,然后按下“CTRL+SHIFT+F11”组合键。
四、解除域的链接首先选择有关域内容,然后按下“CTRL+SHIFT+F9”组合键即可解除域的链接,此时当前的域结果就会变为常规文本(即失去域的所有功能),以后它当然再也不能进行更新了。
用户若需要重新更新信息,必须在文档中插入同样的域才能达到目的。
五、用域创建上划线在“插入”菜单项下选“域”,在“域代码”处输入EQ开关参数,确定。
注意在“EQ”和开关参数之间有一个空格,例如输入Y平均值(Y带有上划线),插入域为“EQ \x\to?Y?”? 单击“确定”后便会出现“Y”的样式。
六、用域输入分数输入分数通常是用WORD的公式编辑器来完成,其实用域输入更简单易行。
操作时首先将光标定位在要输入分数(例如输入“”)的地方,按“Ctrl+F9”,(也可以单击菜单栏“插入”“域”命令,然后在“域名”列表框中找到“eq”项后,单击“域”对话框下面的“确定”即可。
插入域定义符“”,然后在“”中输入表示公式的字符串“eq空格\f(a ? b) ”,然后在其上单击鼠标右键,在弹出的快捷菜单中选择“切换到域代码”命令,就会产生域结果“”。
对于带分数,只需在真分数“”前面输入整数部分1就变成了带分数“1”。
当然你可以极大地发挥他的作用和你的聪明才智,综合应用这些域,灵活地输入像“”等形式的分数。
而且用这种方法输入的分数等域结果在排版时会跟随其他文字一同移动,不会像使用公式编辑器插入的对象那样会因排版而错位。
如果输入分数较多,可以先输入一个分数的域代码,然后复制、粘贴再进行数值修改即可提高输入速度。
在“eq空格\f(a ? b) ”中,eq表示创建科学公式的域名, \f???为创建分式公式的开关选项。
其他常用开关选项还有创建根式的\r???、创建上标下标的\s???、以及建立积分的\i????等。
关于域代码和公式的对应关系,可以查看WORD中关于域的“帮助”信息。
七、用域统计文档字数①将鼠标定位到需要字数统计的地方(如文档未尾),然后输入关于提示字数统计结果的文字(如“本文总字数为:” )。
②在菜单栏中选择“插入”“域”命令项,进入到“域”对话框。
③在“域”对话框中,首先选择“类别”列表中的“文档信息”项,然后从“域名”列表框中选择“NumWords”项。
该项用于统计文档总字数,也可以根据需要选择“NumChars”项来统计文档总字符数,选择“NumPages”项来统计文档的总页数,再使用左键单击“选项”按钮,进入到“域选项”对话框中。
④在“域选项”对话框中,先在“格式”列表框中选择“1,2,3,…”项,然后单击“添加到域”按钮,将所选择的格式添加到域格式中,再单击“确定”按钮返回到“域”对话框中。
⑤在“域”对话框中单击“确定”按钮,即可关闭所有对话框,并返回到文档编辑状态,此时可以看到在当前光标处显示出了“本文总字数:XXXX”的字样。
⑥当插入上述域之后,如果对文档进行了修改,移动鼠标将光标定位在域代码上(此时颜色会变为灰色),然后按下F9键,WORD会自动更新该域,并显示出更新后的总字数。
⑦为了方便,我们可以在每篇文档中都插入字灵敏统计结果 。
方法:打开WORD的其用模板(Normal.dot),然后按照上述方法将有关字数统计的域插入该文件中,以后所建立的每一篇文档中就会自动带有字数统计功能。
如何迅速将Word转换为Html
展开全部 打开word文档,单击菜单栏中的“文件”,找到“另存为” 或“另存为网页”,如图所示。
击另存为” 或“另存为网页”,弹出"另存为" 窗口, 如图所示。
在"另存为" 窗口的“保存类型”,下拉菜单中找到“网页”。
在“文件名”一栏中可以修改我们想要的文件名。
点“保存”,就把一篇word文档保存成网页格式了。
这时候在桌面就可以找到保存的网页,然后用浏览器会打开并显示网页的内容。
...
rtf文本格式如何转换html格式(c#代码实现)
将RTF格式的文件转成HTML并在网页中显示的代码 它是这样工作的,将一个RTF文件上传,然后转成HTML显示出来,代码有点复杂,teaman还要好好研究,好象中文版有点问题。
" method=post> Send this file: "; $bullets += $line; $tags = ereg_replace("\\\par", "", $tags); $tags = ereg_replace("\\\(tab)", "", $tags); } if($line - $bullets == 0) { $tags = ereg_replace("\\\par", "", $tags); } elseif($line - $bullets == 1) { if(ereg("\\\pntext", $tags)) { $html .= ""; $tags = ereg_replace("\\\par", "", $tags); $tags = ereg_replace("\\\(tab)", "", $tags); $bullets++; } else { $html .= ""; $bullets = 0; } } // Convert Bold. if(ereg("\\\b0", $tags)){ $html .= ""; } elseif(ereg("\\\b", $tags)) { $html .= ""; } // Convert Italic. if(ereg("\\\i0", $tags)){ $html .= ""; } elseif(ereg("\\\i", $tags)) { $html .= ""; } // Convert Underline. if(ereg("\\\ulnone", $tags)){ $html .= ""; } elseif(ereg("\\\ul", $tags)){ $html .= ""; } // Convert Alignments. if(ereg("\\\pard\\\qc", $tags)) { $html .= ""; } elseif(ereg("\\\pard\\\qr", $tags)) { $html .= ""; } elseif(ereg("\\\pard", $tags)){ $html .= ""; } // Remove \pard from the tags so it does // n't get confused with \par. $tags = ereg_replace("\\\pard", "", $tags); // Convert line breaks. if(ereg("\\\par", $tags)){ $html .= ""; } // Use the color table to capture the fo // nt color changes. if(ereg("\\\cf[0-9]", $tags)) { global $fcolor; $numcolors = count($fcolor); for($i = 0; $i "; } // Replace \tab with alternating spaces // and nonbreakingwhitespaces. if(ereg("\\\(tab)", $tags)) { $html .= " "; } return $html; } function ProcessWord($word) { // Replace \\ with \ $word = ereg_replace("[\\]{2,}", "\\", $word); // Replace \{ with { $word = ereg_replace("[\\][\{]", "\{", $word); // Replace \} with } $word = ereg_replace("[\\][\}]", "\}", $word); // Replace 2 spaces with one space. $word = ereg_replace(" ", " ", $word); return $word; } $color = "000000"; $size = 1; $bullets = 0; // Read the uploaded file into an array. // $rtfile = file($userfile); $fileLength = count($rtfile); // Loop through the rest of the array for($i = 1; $i 不行的话试试这个 { //创建一个word的实例 Word.Application newApp = new Word.Application(); // 指定源文件和目标文件 object Source="c:\\abc\\Source.doc"; object Target="c:\\abc\\Target.rtf"; object Unknown =Type.Missing; // 打开要转换的Word文件 newApp.Documents.Open(ref Source,ref Unknown, ref Unknown,ref Unknown,ref Unknown, ref Unknown,ref Unknown,ref Unknown, ref Unknown,ref Unknown,ref Unknown, ref Unknown ); // 指定文档的类型 object format = Word.WdSaveFormat.wdFormatRTF; //改变文档类型 newApp.ActiveDocument.SaveAs(ref Target,ref format, ref Unknown,ref Unknown,ref Unknown, ref Unknown,ref Unknown,ref Unknown, ref Unknown,ref Unknown,ref Unknown); //关闭word实例 newApp.Quit(ref Unknown,ref Unknown,ref Unknown); } } } 或是这种方法 在richtohtml函数中增加下面的代码就行了:Dim strLastFontsize As Long If strLastFontsize rtbRichTextBox.SelFontSize Then strLastFontsize = rtbRichTextBox.SelFontSize strHTML$ = strHTML$ + "" End If
250分最高分:求把rtf格式的文本转成HTML格式的代码
1、实现富文本中样式代码的分离;2、保留CSS样式;其实以上两个步骤是相互矛盾的处理过程,无法通过Jacob或POI组件加正则表达式过滤解决,于是进行了以下步骤的实验:1、首先创建了一个空白word文档,格式(office 2003格式或office 2007格式)不限;2、将word格式保存为html格式,通过Edit Plus打开,发现代码中使用了office的命名空间,同时使用了office命名空间的标签定义了CSS样式,自己测试了一下,将生成的html文件头和尾拷贝出来:代码如下:以上HTML头是office的命名空间定义。
3、将使用富文本代码粘贴到红色标识的中,并以doc或docx格式保存文件;4、大功告成,打开文件时,Word将会以“Web版视图”完美显示了富文本样式,成功解决了富文本代码中样式代码,并同时保留了格式;目前研究的仅能保存文字,未处理有图片的代码,朋友们可以再研究一下带图片的富文本代码的转换;
用C#将WORD文档转化为网页保存
class WordToHtml{ public static void CreateWordToHtmlFile(string WordFileDir) { DealWithWordFile(WordFileDir); } //搜索WordFileDir在的*.doc文件 private static void DealWithWordFile(string WordFileDir) { //创建数组保存源文件夹下的文件名 string[] strFiles = Directory.GetFiles(WordFileDir, "*.doc"); for (int i = 0; i < strFiles.Length; i++) { WordToHtmlFile(strFiles[i]); } DirectoryInfo dirInfo = new DirectoryInfo(WordFileDir); //取得源文件夹下的所有子文件夹名称 DirectoryInfo[] ZiPath = dirInfo.GetDirectories(); for (int j = 0; j < ZiPath.Length; j++) { //获取所有子文件夹名 string strZiPath = WordFileDir + "\" + ZiPath[j].ToString(); //把得到的子文件夹当成新的源文件夹,从头开始新一轮的搜索 DealWithWordFile(strZiPath); } } //转化 private static void WordToHtmlFile(string WordFilePath) { try { Microsoft.Office.Interop.Word.Application newApp = new Microsoft.Office.Interop.Word.Application(); // 指定原文件和目标文件 object Source = WordFilePath; string SaveHtmlPath = WordFilePath.Substring(0, WordFilePath.Length - 3) + "html"; object Target = SaveHtmlPath; // 缺省参数 object Unknown = Type.Missing; //为了保险,只读方式打开 object readOnly = true; // 打开doc文件 Microsoft.Office.Interop.Word.Document doc = newApp.Documents.Open(ref Source, ref Unknown, ref readOnly, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown); // 指定另存为格式(rtf) object format = Microsoft.Office.Interop.Word.WdSaveFormat.wdFormatHTML; // 转换格式 doc.SaveAs(ref Target, ref format, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown, ref Unknown); // 关闭文档和Word程序 doc.Close(ref Unknown, ref Unknown, ref Unknown); newApp.Quit(ref Unknown, ref Unknown, ref Unknown); } catch(Exception e) { System.Windows.Forms.MessageBox.Show(e.Message); } } }Word转html类,自己调用吧.
用word 无法打开html
在一些静态网站的内容发布时,经常需要把Word格式的通讯稿制作成html文件发布出来,同时保持原Word文档的格式不变。
如何进行制作,需要注意哪些问题,且看下文。
工具/原料wordNotePad++方法/步骤用微软的Word软件打开需要转换的Word文档,选择“文件”-》“另存为”,格式选择为html网页,进行保存。
用记事本、NotePad++等纯文本编辑工具打开刚存的html文件,注意不要用word等工具打开。
仅选择body标签中的div部分,不需要选择全部的html内容。
将上面步骤选择的文本(整个div)复制到需要制作的html的模板中,进行替换。
一般静态网站制作的内容页都有一个模板,将该内容复制到需替换的位置进行保存,预览效果。
注意如果内容中有图片或者超链接,需手工修改。
这时你应该能够看到与原Word相同格式的html页面了。
word生成html在线帮助,还要可供下载的本地chm文件
转载自(http://zhidao.baidu.com/question/172791621.html)软件下载:下载esaychm制作软件(百度一下,遍地都是……)前期准备:步骤一:先将要准备做成CHM的资料,用WORD文档按段落章节的顺序编辑好(一个段落编辑成一个文档)。
步骤二:将这些编辑好的WORD通过另存为命令,保存成*.htm格式,保存完以后会生成相应的HTML文件和一个后缀为files的文件夹。
步骤三:统一将HTML文件和相应的文件夹,放入新的文件夹(段落名称的那个文件夹)中。
开始制作:步骤一:打开EasyCHM步骤二:新建工程,在新建工程窗口—搜索选项中,可对标题与图标等的设置。
工程目录是前期准备中你存放HTML文件的文件夹的路径。
步骤二:通过easychm左边的 方向箭头按钮对文件的顺序进行调整。
步骤三:将目录中的后缀为.files的文件夹删除。
步骤四:将索引标签下的header文件也都删除。
双击文件的名称可以进行重命名。
步骤五:保存一下。
(不要望啊TAT,否则白做了咯)步骤六:点击 编译进行编译。
点击后,可在出现的窗口中更改CHM的标题,CHM的第一页,CHM的主页,CHM保存的地址以及CHM的设置。
步骤七:点击生成CHM文件。
步骤 八:查看做好的CHM文件。
(注:不同语言,应在不同语言的操作系统中制作。
)
转载请注明出处51数据库 » nopi word to html
丶浅陌丶