一、word2vec和深度学习有什么关系
1、计算机视觉
ImageNet Classification with Deep Convolutional Neural Networks, Alex Krizhevsky, Ilya Sutskever, Geoffrey E Hinton, NIPS 2012.
Learning Hierarchical Features for Scene Labeling, Clement Farabet, Camille Couprie, Laurent Najman and Yann LeCun, IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013.
Learning Convolutional Feature Hierarchies for Visual Recognition, Koray Kavukcuoglu, Pierre Sermanet, Y-Lan Boureau, Karol Gregor, Micha?l Mathieu and Yann LeCun, Advances in Neural Information Processing Systems (NIPS 2010), 23, 2010.
2、语音识别
微软研究人员通过与hintion合作,首先将RBM和DBN引入到语音识别声学模型训练中,并且在大词汇量语音识别系统中获得巨大成功,使得语音识别的错误率相对减低30%。但是,DNN还没有有效的并行快速算法,很多研究机构都是在利用大规模数据语料通过GPU平台提高DNN声学模型的训练效率。
在国际上,IBM、google等公司都快速进行了DNN语音识别的研究,并且速度飞快。
国内方面,阿里巴巴,科大讯飞、百度、中科院自动化所等公司或研究单位,也在进行深度学习在语音识别上的研究。
3、自然语言处理等其他领域
很多机构在开展研究,2013年Tomas Mikolov,Kai Chen,Greg Corrado,Jeffrey Dean发表论文Efficient Estimation of Word Representations in Vector Space建立word2vector模型,与传统的词袋模型(bag of words)相比,word2vector能够更好地表达语法信息。 深度学习在自然语言处理等领域主要应用于机器翻译以及语义挖掘等方面。
二、如何用python安装woord2vector
gensim 用conda install gensim 与pip install gensim 安装是不同的提示C编译器会更快,windows下装了MinGW 中文wiki处理gensim模块中有专门处理wiki语料的函数中文分词还是用的jieba因为wiki百科有繁体,简繁体转换用了 还有最开始程序运行有问题,发现了自己python的一个坏习惯,应该把程序写成函数[python] view plain copyif __name__ == '__main__': my_function() 这样子python import这个文件就不会发生问题[python] view plain copy# -*- coding: utf-8 -*- from gensim.corpora import WikiCorpus import jieba from langconv import * _author__ = 'Lust' # read the wiki.xml.bz2 # transform it to simplified Chinese (use langconv) # Chinese text segmentation(use jieba) # save it as txt def my_function(): space = " " i = 0 l = [] a = '..//data//zhwiki-latest-pages-articles.xml.bz2' f = open('..//data//reduce_zhiwiki.txt', 'w') wiki = WikiCorpus(a, lemmatize=False, dictionary={}) # texts = wiki.get_texts() for text in wiki.get_texts(): for temp_sentence in text: temp_sentence = Converter('zh-hans').convert(temp_sentence.decode('utf-8')) temp_sentence = temp_sentence.encode('utf-8') seg_list = list(jieba.cut(temp_sentence)) # for temp_term in temp_sentence: for temp_term in seg_list: l.append(temp_term.encode('utf-8')) f.write(space.join(l) + "\n") l = [] i = i + 1 print "Saved " + str(i) + " articles" # limit number of wikis if (i == 100): break f.close() if __name__ == '__main__': my_function() gensim中的word2vector超级简单,一个函数的事情。
唯一要注意的是workers=multiprocessing.cpu_count()-4,如果不-4,win10会蓝屏,因为CPU总是100%,把电脑累蓝了?[python] view plain copy# -*- coding: utf-8 -*- from gensim.models import Word2Vec from gensim.models.word2vec import LineSentence import multiprocessing _author__ = 'Lust' # read the txt # word2vec it # save it as model and vector def my_function(): a = open('..//data//zhiwiki_news.txt', 'r') f_1 = open('..//result//zhiwiki_news.model', 'w') f_2 = open('..//result//zhiwiki_news.vector', 'w') model = Word2Vec(LineSentence(a), size=400, window=5, min_count=5, workers=multiprocessing.cpu_count()-4) model.save(f_1) model.save_word2vec_format(f_2, binary=False) if __name__ == '__main__': my_function() 使用训练好的模型[python] view plain copy# -*- coding: utf-8 -*- import gensim _author__ = 'Lust' # read the news # Chinese text segmentation(use jieba) # add it to zhiwiki_news def my_function(): model = gensim.models.Word2Vec.load_word2vec_format("wiki.en.text.vector", binary=False) model.most_similar("man") model.similarity("woman", "girl") if __name__ == '__main__': my_function()。
三、用PPT做的原理图怎么才能清晰的插到word里
将PROTEL DXP中的原理图导入到WORD或PPT中的方法是:
【TOOLS】->;【Preferences】在弹出的对话框中选中【Graphical Editding】
然后撤销对其中的【Add Template To Clipboard】复选框的选中
接下来在原理图中选中要复制的原理图的部分,【Ctrl+C】,鼠标变成十字形的光标,点击被选中部分的中心。
然后打开WORD或PPT,粘贴到要粘贴的地方就行了。
用这种方法获取的电路图不会因为在编辑时放大或缩小图片而失真。而且它获取的仅仅是电路图中的元件和导线,不会覆盖文档中的背景。
四、怎样将PROTEL的电路图粘到WORD 中
将protel原理图插入到word中的方法很简单
原文来源于http://www.neeeu.com/Protel/ShowArticle.asp?ArticleID=180
很多初学者都要复制原理到Word中将电路图打印出来,但有时就粘贴不出来,或者出现有protel的背景颜色,或者电路图很小,几乎看不清。这也是早期protel的缺点,在protel DXP 2004版本以及以后的版本复制都很简单。不过凡事都有解决方法,在此贴出一些方法,希望对大家有帮助。由于protel版本的不同,将图片插入到Word中的方法也不一样。以下对protel各种版本中的操作分别说明。
方法一:
这是一种简单的方法。对于protel dxp 和protel 99SE都适用。缺点是选择局部原理图时,如果某个元件或者导线没有完全被选中,就没有被复制上粘贴板。但大多数人都是要复制整图的,所以这个方法很适用。
方法如下:
在原理图界面点击Tools --- Preferences。 --- 选择Graphical Editing
--- 把Add Template to pboard 前面的勾去掉,再复制时,就是只复制原理图了。没有带上背景颜色和图框。
方法二:
此法其实也是很简单,只是我说得详细了一点,看起来有点复杂了。
(一)对于protel 99SE版本
在原理图点击右键,选择Document Options。【其实完全和以下的(二)protel dxp版本相同】请参看(二)。
(二)对于protel dxp版本
直接将原理图复制后粘贴到Word中时,会出现两种情况
1. protel整张页面都复制过来了,且电路图有可能很小。
2. 背景的颜色也被复制过来了,protel中默认背景颜色为灰色,复制到Word中很不好看。
按照以下步骤做,将会得到一张漂亮的电路图在你的Word中
①protel dxp原理图界面中
点击右键 --- Document Options。 --- Sheet Options --- 双击Option Color --- 在Basic中选择白色(序号为233)---OK
②选中整张电路图(可以用快捷键Ctrl+A)--- Edit --- copy --- 此时鼠标上多了一个十字 --- 在页面任意处点击一下左键(一定要点击,否则没有复制上)。
③Word中
右键 --- 粘贴
④视图 --- 工具栏 --- 图片(要打钩)
⑤点击图片(此时有黑点围住图片)--- 点击裁剪工具(如下图)--- 把鼠标指到图片的黑点上点击左键不放,向图片中心移去,就可以裁剪图片了---
再点击黑点将图片拉大就完成了。
(三)对于DXP 2004 SP2版本
在这里就方便多了,直接复制后粘贴到Word中即可。复制也不像在protel dxp中那么复杂。粘贴后也就只有图粘贴过去,不带背景。
(四)对于Altium Designer版本
原理图复制同DXP 2004,还有更大的功能就是PCB图都可以直接复制粘贴到Word中!软件本身自带将图纸转换成PDF格式保存。
图片见http://www.neeeu.com/Protel/ShowArticle.asp?ArticleID=180
转载请注明出处51数据库 » wordtovector原理
你的亲爹临死前居然