python 读word 的表格

python如何获取word文件中某个关键字之后的表格

最好是全部都读取到程序中，在程序中进行判断。

本文实例讲述了Python实现批量读取word中表格信息的方法。

分享给大家供大家参考。

具体如下：单位收集了很多word格式的调查表，领导需要收集表单里的信息，我就把所有调查表放一个文件里，写了个python小程序把所需的信息打印出来#coding:utf-8import osimport win32comfrom win32com.client import Dispatch, constantsfrom docx import Documentdef parse_doc(f):＂＂＂读取doc，返回姓名和行业＂＂＂doc = w.Documents.Open( FileName = f )t = doc.Tables[0] # 根据文件中的图表选择信息name = t.Rows[0].Cells[1].Range.Textsituation = t.Rows[0].Cells[5].Range.Textpeople = t.Rows[1].Cells[1].Range.Texttitle = t.Rows[1].Cells[3].Range.Textprint name, situation, people,titledoc.Close()def parse_docx(f):＂＂＂读取docx，返回姓名和行业＂＂＂d = Document(f)t = d.tables[0]name = t.cell(0,1).textsituation = t.cell(0,8).textpeople = t.cell(1,2).texttitle = t.cell(1,8).textprint name, situation, people,titleif __name__ == ＂__main__＂:w = win32com.client.Dispatch('Word.Application')# 遍历文件PATH = ＂H:\work\\aaa＂ # windows文件路径doc_files = os.listdir(PATH)for doc in doc_files:if os.path.splitext(doc)[1] == '.docx':try:parse_docx(PATH+'\\'+doc)except Exception as e:print eelif os.path.splitext(doc)[1] == '.doc':try:parse_doc(PATH+'\\'+doc)except Exception as e:print e希望本文所述对大家的Python程序设计有所帮助。

python操作word文档表格

office 2007中不能直接打开VB编辑器，请按Alt + F11打开。

import win32com.client # 导入脚本模块 WordApp = win32com.client.Dispatch(＂Word.Application＂) # 载入WORD模块 WordApp.Visible = True # 显示Word应用程序 1、新建Word文档 doc = WordApp.Documents.Add() # 新建空文件 doc = WordApp.Documents.Open(r＂d:\2011专业考试计划.doc＂) # 打开指定文档 doc.SaveAs(r＂d:\2011专业考试计划.doc＂) # 文档保存 doc.Close(-1) # 保存后关闭，doc.Close（)或doc.Close(0)直接关闭不保存 2、页面设置 doc.PageSetup.PaperSize = 7 # 纸张大小， A3=6, A4=7 doc.PageSetup.PageWidth = 21*28.35 # 直接设置纸张大小，使用该设置后PaperSize设置取消 doc.PageSetup.PageHeight = 29.7*28.35 # 直接设置纸张大小 doc.PageSetup.Orientation = 1 # 页面方向，竖直=0，水平=1 doc.PageSetup.TopMargin = 3*28.35 # 页边距上=3cm,1cm=28.35pt doc.PageSetup.BottomMargin = 3*28.35 # 页边距下=3cm doc.PageSetup.LeftMargin = 2.5*28.35 # 页边距左=2.5cm doc.PageSetup.RightMargin = 2.5*28.35 # 页边距右=2.5cm doc.PageSetup.TextColumns.SetCount(2) # 设置页面分栏=2 3、格式设置 sel = WordApp.Selection # 获取Selection对象 sel.InsertBreak(8) # 插入分栏符=8，分页符=7 sel.Font.Name = ＂黑体＂ # 字体 sel.Font.Size = 24 # 字大 sel.Font.Bold = True # 粗体 sel.Font.Italic = True # 斜体 sel.Font.Underline = True # 下划线 sel.ParagraphFormat.LineSpacing = 2*12 # 设置行距，1行=12磅 sel.ParagraphFormat.Alignment = 1 # 段落对齐，0=左对齐，1=居中，2=右对齐 sel.TypeText(＂XXXX＂) # 插入文字 sel.TypeParagraph() # 插入空行注：ParagraphFormat属性必须使用TypeParagraph（)之后才能二次生效

python调用com,如何完成word表格操作

word中doc这个格式的文件是微软特有格式，微软没有向外公开任何的api接口文档，只能通过微软提供的OLE组件来提其COM接口，只要你的机器上安装了Offices完整的办公软件，在安装目录下面有个MSWORD.OLB组件，导入这个即可。

1、相关操作Excel有MSPPT.OLB,EXCEL.exe等。

怎么用python读取excel表格的数据

一、读excel表读excel要用到xlrd模块，官网安装（http://pypi.python.org/pypi/xlrd）。

然后就可以跟着里面的例子稍微试一下就知道怎么用了。

大概的流程是这样的：1、导入模块复制代码代码如下：import xlrd2、打开Excel文件读取数据复制代码代码如下：data = xlrd.open_workbook('excel.xls')3、获取一个工作表① table = data.sheets()[0] #通过索引顺序获取② table = data.sheet_by_index(0) #通过索引顺序获取③ table = data.sheet_by_name(u'Sheet1')#通过名称获取4、获取整行和整列的值（返回数组）复制代码代码如下：table.row_values(i)table.col_values(i)5、获取行数和列数复制代码代码如下：table.nrowstable.ncols6、获取单元格复制代码代码如下：table.cell(0,0).valuetable.cell(2,3).value就我自己使用的时候觉得还是获取cell最有用，这就相当于是给了你一个二维数组，余下你就可以想怎么干就怎么干了。

得益于这个十分好用的库代码很是简洁。

但是还是有若干坑的存在导致话了一定时间探索。

现在列出来供后人参考吧：1、首先就是我的统计是根据姓名统计各个表中的信息的，但是调试发现不同的表中各个名字貌似不能够匹配，开始怀疑过编码问题，不过后来发现是因为空格。

因为在excel中输入的时候很可能会顺手在一些名字后面加上几个空格或是tab键，这样看起来没什么差别，但是程序处理的时候这就是两个完全不同的串了。

我的解决方法是给每个获取的字符串都加上strip（)处理一下。

效果良好2、还是字符串的匹配，在判断某个单元格中的字符串（中文）是否等于我所给出的的时候发现无法匹配，并且各种unicode也不太奏效，百度过一些解决方案，但是都比较复杂或是没用。

最后我采用了一个比较变通的方式：直接从excel中获取我想要的值再进行比较，效果是不错就是通用行不太好，个呢不能问题还没解决。

二、写excel表写excel表要用到xlwt模块，官网下载（http://pypi.python.org/pypi/xlwt）。

大致使用流程如下：1、导入模块复制代码代码如下：import xlwt2、创建workbook（其实就是excel，后来保存一下就行）复制代码代码如下：workbook = xlwt.Workbook(encoding = 'ascii')3、创建表复制代码代码如下：worksheet = workbook.add_sheet('My Worksheet')4、往单元格内写入内容复制代码代码如下：worksheet.write(0, 0, label = 'Row 0, Column 0 Value')5、保存复制代码代码如下：workbook.save('Excel_Workbook.xls')由于我的需求比较简单，所以这上面没遇到什么问题，唯一的就是建议还是用ascii编码，不然可能会有一些诡异的现象。

当然xlwt功能远远不止这些，他甚至可以设置各种样式之类的。

附上一点例子复制代码代码如下：Examples Generating Excel Documents Using Python's xlwtHere are some simple examples using Python's xlwt library to dynamically generate Excel documents.Please note a useful alternative may be ezodf, which allows you to generate ODS (Open Document Spreadsheet) files for LibreOffice / OpenOffice. You can check them out at:http://packages.python.org/ezodf/index.htmlThe Simplest Exampleimport xlwtworkbook = xlwt.Workbook(encoding = 'ascii')worksheet = workbook.add_sheet('My Worksheet')worksheet.write(0, 0, label = 'Row 0, Column 0 Value')workbook.save('Excel_Workbook.xls')Formatting the Contents of a Cellimport xlwtworkbook = xlwt.Workbook(encoding = 'ascii')worksheet = workbook.add_sheet('My Worksheet')font = xlwt.Font() # Create the Fontfont.name = 'Times New Roman'font.bold = Truefont.underline = Truefont.italic = Truestyle = xlwt.XFStyle() # Create the Stylestyle.font = font # Apply the Font to the Styleworksheet.write(0, 0, label = 'Unformatted value')worksheet.write(1, 0, label = 'Formatted value', style) # Apply the Style to the Cellworkbook.save('Excel_Workbook.xls')Attributes of the Font Objectfont.bold = True # May be: True, Falsefont.italic = True # May be: True, Falsefont.struck_out = True # May be: True, Falsefont.underline = xlwt.Font.UNDERLINE_SINGLE # May be: UNDERLINE_NONE, UNDERLINE_SINGLE, UNDERLINE_SINGLE_ACC, UNDERLINE_DOUBLE, UNDERLINE_DOUBLE_ACCfont.escapement = xlwt.Font.ESCAPEMENT_SUPERSCRIPT # May be: ESCAPEMENT_NONE, ESCAPEMENT_SUPERSCRIPT, ESCAPEMENT_SUBSCRIPTfont.family = xlwt.Font.FAMILY_ROMAN # May be: FAMILY_NONE, FAMILY_ROMAN, FAMILY_SWISS, FAMILY_MODERN, FAMILY_SCRIPT, FAMILY_DECORATIVEfont.charset=utf-8.Font.CHARSET_ANSI_LATIN # May be: CHARSET_ANSI_LATIN, CHARSET_SYS_DEFAULT, CHARSET_SYMBOL, CHARSET_APPLE_ROMAN, CHARSET_ANSI_JAP_SHIFT_JIS, CHARSET_ANSI_KOR_HANGUL, CHARSET_ANSI_KOR_JOHAB, CHARSET_ANSI_CHINESE_GBK, CHARSET_ANSI_CHINESE_BIG5, CHARSET_ANSI_GREEK, CHARSET_ANSI_TURKISH, CHARSET_ANSI...

python读取word中合并单元格输出到excel

Python替换某个文本中的字符串，然后生成新的文本文档，代码如下：import osos.chdir('D：\\') # 跳到D盘if not os.path.exists('test1.txt')： # 看一下这个文件是否存在exit(-1) #不存在就退出lines = open('test1.txt').readlines（) #打开文件，读入每一行fp = open(''test2.txt','w') #打开你要写得文件test2.txtfor s in lines:# replace是替换，write是写入fp.write( s.replace('love','hate').replace('yes','no')) fp.close（) # 关闭文件

转载请注明出处51数据库 » python 读word 的表格