哪位朋友能介绍一下支持向量机工具libsvm的用法
LIBSVM的简单介绍 2006-09-20 15:59:48 大 中 小 1. LIBSVM 软件包简介 LIBSVM 是台湾大学林智仁(Chih-Jen Lin)博士等开发设计的一个操作简单、易于使用、快速有效的通用SVM 软件包,可以解决分类问题(包括C- SVC、n - SVC )、回归问题(包括e - SVR、n - SVR )以及分布估计(one-class-SVM )等问题,提供了线性、多项式、径向基和S形函数四种常用的核函数供选择,可以有效地解决多类问题、交叉验证选择参数、对不平衡样本加权、多类问题的概率估计等。
LIBSVM 是一个开源的软件包,需要者都可以免费的从作者的个人主页http://www.csie.ntu.edu.tw/~cjlin/处获得。
他不仅提供了LIBSVM的C++语言的算法源代码,还提供了Python、Java、R、MATLAB、Perl、Ruby、LabVIEW以及C#.net 等各种语言的接口,可以方便的在Windows 或UNIX 平台下使用。
另外还提供了WINDOWS 平台下的可视化操作工具SVM-toy,并且在进行模型参数选择时可以绘制出交叉验证精度的等高线图。
2. LIBSVM 使用方法简介 LibSVM是以源代码和可执行文件两种方式给出的。
如果是Windows系列操作系统,可以直接使用软件包提供的程序,也可以进行修改编译;如果是Unix类系统,必须自己编译。
LIBSVM 在给出源代码的同时还提供了Windows操作系统下的可执行文件,包括:进行支持向量机训练的svmtrain.exe;根据已获得的支持向量机模型对数据集进行预测的svmpredict.exe;以及对训练数据与测试数据进行简单缩放操作的svmscale.exe。
它们都可以直接在DOS 环境中使用。
如果下载的包中只有C++的源代码,则也可以自己在VC等软件上编译生成可执行文件。
3. LIBSVM 使用的一般步骤是:1) 按照LIBSVM软件包所要求的格式准备数据集;2) 对数据进行简单的缩放操作;3) 考虑选用RBF 核函数;4) 采用交叉验证选择最佳参数C与g ;5) 采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型;6) 利用获取的模型进行测试与预测。
4. LIBSVM使用的数据格式1)训练数据和检验数据文件格式如下: : : ... 其中 是训练数据集的目标值,对于分类,它是标识某类的整数(支持多个类);对于回归,是任意实数。
是以1开始的整数,可以是不连续的;为实数,也就是我们常说的自变量。
检验数据文件中的label只用于计算准确度或误差,如果它是未知的,只需用一个数填写这一栏,也可以空着不填。
在程序包中,还包括有一个训练数据实例:heart_scale,方便参考数据文件格式以及练习使用软件。
可以编写小程序,将自己常用的数据格式转换成这种格式2)Svmtrain和Svmpredict的用法 LIBSVM软件提供的各种功能都是DOS命令执行方式。
我们主要用到两个程序,svmtrain(训练建模)和svmpredict(使用已有的模型进行预测),下面分别对这两个程序的使用方法、各参数的意义以及设置方法做一个简单介绍: (1)Svmtrain的用法: svmtrain [options] training_set_file [model_file]Options:可用的选项即表示的涵义如下-s svm类型:SVM设置类型(默认0) 0 -- C-SVC 1 --v-SVC 2 – 一类SVM 3 -- e -SVR 4 -- v-SVR-t 核函数类型:核函数设置类型(默认2) 0 – 线性:u'v 1 – 多项式:(r*u'v + coef0)^degree 2 – RBF函数:exp(-r|u-v|^2) 3 –sigmoid:tanh(r*u'v + coef0)-d degree:核函数中的degree设置(默认3)-g 函数设置(默认1/ k)r(gama):核函数中的-r coef0:核函数中的coef0设置(默认0)-c cost:设置C-SVC, -SVR的参数(默认1)-SVR和- SVR的参数(默认0.5)-SVC,一类SVM和-n nu:设置-SVR-p e:设置的值(默认0.1)中损失函数-m cachesize:设置cache内存大小,以MB为单位(默认40)-e :设置允许的终止判据(默认0.001)-h shrinking:是否使用启发式,0或1(默认1)-wi C(C-SVC中的C)(默认1)weight:设置第几类的参数C为weight-v n: n-fold交互检验模式 其中-g选项中的k是指输入数据中的属性数。
option -v 随机地将数据剖分为n部分并计算交互检验准确度和均方根误差。
以上这些参数设置可以按照SVM的类型和核函数所支持的参数进行任意组合,如果设置的参数在函数或SVM类型中没有也不会产生影响,程序不会接受该参数;如果应有的参数设置不正确,参数将采用默认值。
training_set_file是要进行训练的数据集;model_file是训练结束后产生的模型文件,文件中包括支持向量样本数、支持向量样本以及lagrange系数等必须的参数;该参数如果不设置将采用默认的文件名,也可以设置成自己惯用的文件名。
(2)Svmpredict的用法: svmpredict test_file model_file output_file model_file 是由svmtrain产生的模型文件;test_file是要进行预测的数据文件;Output_file是svmpredict的输出文件。
svm-predict没有其它的选项。
下面是具体的使用例子svmtrain -s 0 -c 1000 -t 1 -g 1 -r 1 -d 3 data_file训练一个由多项式核(u'v+1)^3和C=1000组成的分类器。
svmtrain -s 1 -n 0.1 -t 2 -g 0.5 -e 0.00001 data_file =-SVM (在RBF核函数exp(-0.5|u-v|^2)和终止允许限0.00001的条件下,训练一个 0.1)分类器。
svmtrain -s 3 -p 0.1 -t 0 -c 10 data_file =以线...
python下使用libsvm能处理数据格式为复数(complex)的数据吗
毋庸置疑,LibSVM是台湾牛人为世界机器学习的卓越贡献之一。
一般都是基于Matlab的,其实LibSVM也可以用Python跑。
第一步,确定本机Python的版本:32位的最易配置,哈哈,我的机器就是这么的古董。
64位的童鞋请Google。
第二步,到官网http://www.csie.ntu.edu.tw/~cjlin/libsvm/,来下载LibSVM软件包,我选择的是zip包。
第三步,将zip包解压到一个特定位置,我放到了C:盘根目录,当然也可以放到program files中。
第四步,就可以测试一下LibSVM是否可用了,打开Python IDE,输入以下代码:能够看到输出,84%的分类准确性。
第五步,使用我的个人数据libsvm的数据格式如下:第一列代表标签,第二列是第一个特征值,第三列是第二个特征值。
所以,先要把数据按规定格式整理好。
然后开始训练。
import osimport sysos.chdir('C:\libsvm-3.17\python')from svmutil import *y, x = svm_read_problem('../lkagain.txt')m = svm_train(y[:275], x[:275], '-c 5')y, x = svm_read_problem('../lk2.txt')p_label, p_acc, p_val = svm_predict(y[0:], x[0:], m)print p_labelprint p_accprint p_val第六步,Python接口在libsvm-3.16的python文件夹下主要包括了两个文件svm.py和svmutil.py。
svmutil.py接口主要包括了high-level的函数,这些函数的使用和LIBSVM的MATLAB接口大体类似svmutil中主要包含了以下几个函数:svm_train() : train an SVM modelsvm_predict() : predict testing datasvm_read_problem() : read the data from a LIBSVM-format file.svm_load_model() : load a LIBSVM model.svm_save_model() : save model to a file.evaluations() : evaluate prediction results.
.nfo文件是做什么用的?
网上流传的d版软件包中,会有一些扩展名为nfo的文件,一般还有一个名叫file_id.diz的文件。
那么这些文件有什么用?怎样打开?在这些nfo文件中,有一个(通常是体积最大的那个)最重要,它记录了该软件的简单介绍、破解信息、安装说明、以及破解组织自己的一些信息。
其余的nfo文件中所包含的信息要少得多,基本可以忽略。
所有这些信息都是英文。
“nfo”来自于单词“information”的第2到第4个字母。
nfo文件的作用现在很清楚了,基本就是这些。
名叫file_id.diz的文件记录了该软件包的全名。
这个文件在互联网发展的早期曾发挥过一定的作用,现在已经基本让位于nfo文件,保留它完全是出于一种习惯,或者说保持向前兼容吧。
nfo文件和file_id.diz的格式是一样的,都是纯文本文件。
要查看他们的内容,用写字板之类的文本编辑器就可以了。
不过,多数情况下大家用写字板打开nfo文件的时候,都会看到很多乱码,这是什么原因呢?要回答这个问题,必须对扩展ASCII有所了解。
扩展ASCII共有256个字符,其中0到7f包括了大部分我们常用的字符,如字母、符号等。
而80及以上的字符并不常用到,其中的一部分被用作制表符。
通常情况下,中文系统用2个ASCII字符合起来表示一个汉字。
但为了不和常用字符冲突,中文系 统用的是80及以上的字符。
但问题在于这些字符也包括了制表符等。
所以 以前的汉字系统经常有汉字识别的问题。
NFO里不仅用到了7f以下的字符, 还大量用到了制表符和非标准换行符。
所以如果我们打开一个NFO,经常可以看到所谓的乱码,就是这个原因!这种现象在非英文的操作系统里尤其普遍。
那么为了正常查看nfo文件的内容,我们需要专用的nfo查看工具。
其实现有的nfo查看工具和普通的文本编辑器并没有很多本质上的不同,只是它们使用标准英文字体来显示文件!借助于它们我们可以正确地看到NFO文件的内容,但是如果nfo文件中有汉字,我们看到的将是乱码。
如果只想看到nfo文件中的文字信息,用任何一种文本编辑器打开它都可以。
如果想看到nfo文件的真面目,最好用专门的工具。
这样的工具现在有很多,网上随便搜一下都可以搜除很多种。
这里我们推荐一种:DAMN_NFO_Viewer_v2.10.0031_Setup.exe在网上可以找到。
如果你经常使用Total Commander这个工具,那么可以在网上搜索它的一个插件nfoviewer,这样用起来会更方便一些。
如果实在找不到或不愿意去寻找专门的工具,也还有一个办法。
那就是使用dos或windows系统自带的文本编辑工具edit。
在dos命令提示符下输入edit即可。
赶紧去试试吧!
软件缺陷怎么描述
认识软件缺陷,首先要了解软件缺陷的概念,其次是了解软件缺陷的详细特征,最后就是它的属性了,再高一个层次就是学习利用管理软件缺陷的工具了。
1、首先介绍软件缺陷的概念 软件缺陷是指系统或系统部件中那些导致系统或部件不能实现其功能的缺陷。
2、软件缺陷的详细特征 a、单一准确 b、可以再现(要求软件缺陷具有精确的步骤) c、完整统一 d、短小简练 e、特定条件 f、补充完整 g、不做评价 3、软件缺陷的属性 软件缺陷的属性包括缺陷标识、缺陷类型、缺陷严重程度、缺陷产生可能性、缺陷优先级、缺陷状态、缺陷起源、缺陷来源、缺陷原因。
下面详细介绍一下以上这些属性: a、缺陷标识:是标记某个缺陷的唯一标识,可以用数字序号表示; b、缺陷类型:功能、用户界面、文档、软件包、性能、系统\模块接口 功能:影响了各种系统功能、逻辑的缺陷; 用户界面:影响了用户界面、人机交互特性,包括屏幕格式、用户输入灵活性、结果输入格式等方面的缺陷; 文档:影响发布和维护,包括注释、用户手册、设计文档; 软件包:由于软件配置库、变更管理或版本控制引起的错误; 性能:不满足系统可测量的属性值,如执行时间、事务处理速率等; 系统\模块接口:与其他组件、模块或设备驱动程序、调用参数、控制块或参数列表等不匹配、冲突。
c、缺陷严重程度:致命(Fatal)、严重(Ceritical)、一般(Major)、较小(Minor) 致命:系统任何一个主要功能完全丧失,用户数据受到破坏,系统崩溃、悬挂、死机或者危机人身安全; 严重:系统的主要功能部分丧失,数据不能保存,系统的次要功能完全丧失,系统所提供的功能或服务受到明显的影响; 一般:系统的次要功能没有完全实现,但不影响用户的正常使用。
例如:提示信息不太准确或用户界面差、操作时间长等一些问题; 较小:使操作者不方便或遇到麻烦,但它不影响功能过的操作和执行,如个别不影响产品理解的错别字、文字排列不整齐等一些小问题 d、缺陷产生可能性:总是、通常、有时、很少 总是:总是产生这个软件缺陷,其产生的频率是100%; 通常:按照测试用例,通常情况下会产生这个软件缺陷,其产生的频率大概是80%—90%; 有时:按照测试用例,有时候产生这个软件缺陷,其产生的频率大概是30%—50%;
简述PowerPoint普通视图的特点
PowerPoint概述 PowerPoint是目前制作演示文稿最常用的工具软件,能够制作出集文字、图形、图像、声音、动画以及视频等多媒体元素于一体的演示文稿,被广泛应用于课堂教学、学术报告、产品展示、教育讲座等各种信息传播活动中。
PowerPoint 2000是由Microsoft公司于2000年推出的演示文稿制作工具,也是Office 2000办公自动化套装软件包中的一个组件,其外观及通用操作都与前述Word2000、Excel2000等保持一致,这里不再赘述。
本章将着重介绍PowerPoint 2000的特有功能。
5.1.2 PowerPoint的功能 作为一种最常用的演示文稿软件,PowerPoint可用于创建5种类型的演示文稿:1、电子演示文稿 PowerPoint所创建的文件称为电子演示文稿,其扩展名为.ppt。
一个电子演示文稿是由若干张电子幻灯片组成的,其中可以包含文本、图表、图形、剪贴画、影片、声音及其他多媒体信息。
制作的电子演示文稿可以在屏幕上演示,或用打印机打印出来。
2、投影幻灯片 可以将电子幻灯片打印在透明胶片上,制作成可在幻灯机上放映的幻灯片。
3、35mm幻灯片 电子幻灯片还可用专门设备转成35mm的幻灯片,用于大型会议等场合的演示放映。
4、备注、讲义和大纲 可以将幻灯片、演讲者备注或包括标题和重点的...或用打印机打印出来,也是Office 2000办公自动化套装软件包中的一个组件、学术报告,PowerPoint可用于创建5种类型的演示文稿PowerPoint概述 PowerPoint是目前制作演示文稿最常用的工具软件.ppt。
5,被广泛应用于课堂教学,这里不再赘述、电子演示文稿 PowerPoint所创建的文件称为电子演示文稿、演讲者备注或包括标题和重点的文件大纲打印出来进行分发。
PowerPoint 2000是由Microsoft公司于2000年推出的演示文稿制作工具、远程教学、Web演示文稿 可以专门为Internet设计演示文稿,也可以阅读文字材料,其外观及通用操作都与前述Word2000,在放映演示文稿时、影片,能够制作出集文字、产品展示,其中可以包含文本:1.1。
2,其扩展名为、讲义和大纲 可以将幻灯片、教育讲座等各种信息传播活动中、声音及其他多媒体信息。
5、剪贴画。
4、声音、图像、图表。
本章将着重介绍PowerPoint 2000的特有功能。
一个电子演示文稿是由若干张电子幻灯片组成的、图形、备注、动画以及视频等多媒体元素于一体的演示文稿,用于大型会议等场合的演示放映、电子商务等等,使用Web浏览器作为演示工具.2 PowerPoint的功能 作为一种最常用的演示文稿软件、35mm幻灯片 电子幻灯片还可用专门设备转成35mm的幻灯片,制作成可在幻灯机上放映的幻灯片。
制作的电子演示文稿可以在屏幕上演示、Excel2000等保持一致,将网页格式的演示文稿副本放置到 Internet上、投影幻灯片 可以将电子幻灯片打印在透明胶片上,观众既可以观看屏幕。
3、图形,如用于视频会议
简述安装Linux软件包通常有哪几种方式,安装当前系统中没有的软件...
包里面主要是软件控制信息和安装内容,包括软件信息和依赖关系。
安装内容大体和win类似,不过文件系统结构不同,会有稍微的区别!区别不是问题。
======================linux分为源码包和安装包,安装包和win类似,源码包就是一堆源码,源码安装的软件需要编译环境,没有环境就无法编译!这个和win也是类似的!楼主了解一下LFS吧!之后就知道linux了
FMRI图像软件 详细介绍下列5个软件加分!!!
1.Advanced Visual Systems-AVS/Express 的缩写是AVSAVS/Express是一个可在各种操作系统下开发可视化应用程序的平台,使用它可以快速建立具有交互式可视化和图形功能的科学和商业应用程序。
开发者可以使用其面向对象的可视化编程环境,在一个开放和可扩展的环境下快速建立应用程序原型,处理海量数据。
AVS/Express提供了有关图形、图像、数据可视化、数据库接口、注释和硬拷贝输出等方面的许多先进技术。
AVS/Express具有大量预制的可视化编程对象,以提供一个功能强大的可视化开发环境。
开发者除了可以使用诸如2D和3D图形观察器之类的高级对象之外,还可对这些高级对象进行重新定制。
AVS/Express的组成部分包括:图形显示软件包提供对文本、二维图像、二维或三维几何对象(非结构网格)和体(三维均匀计算网格和三维显示空间)进行显示和处理的图形组件基本技术;数据可视化软件包包括为可视化和分析大范围数据集而特别设计的对象、数据结构和函数库;图像处理软件包是一个分析和处理AFNI-Medical College of Wiscosin 图像的巨大函数库。
2.AFNI-Medical College of Wiscosin 是一个交互式的脑功能成像数据分析软件,它可以将低分辨率的脑功能成像的实验结果叠加在具有较高分辨率的结构脑图像上进行三维显示;通过选择一些特定的特征点,它可以将实验数据转换到立体定位(talairach-tournoux)坐标;它可以同时在屏幕上显示三个正交的平面图像,显示的图像可以在各种功能和解剖数据之间互相转换;其附加的程序包可以对三维图像数据集进行操作和融合3.Math Works-Matlab可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连matlab开发工作界面接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。
4.SPM-Wellcome Department of Cognitive Neurology 是指建造和使用,以测试有关功能成像数据的统计假设空间扩展过程的评估。
这些想法已经实例化软件,就是所谓的扫描探针显微镜。
SPM软体包的序列,设计了用于数据分析的脑成像研究。
该序列可以是来自不同世代的图像,或时间从同一主题的系列产品。
目前的版本是专为功能性磁振造影,涤纶,SPECT显像,脑电图和MEG分析。
5.Vital Images-VoxelView &Vitrea该技术使放射科医师,心脏病,肿瘤和其他医学专家,省时的生产力和通讯,可以访问整个企业,并通过了在医药日常的日常实践中容易使用的Web工具。
至关重要的图像也已在欧洲和亚洲设有办事处
请问nfo文件用什么打开?MSInfo文件
在这些nfo文件中,有一个(通常是体积最大的那个)最重要,它记录了该软件的简单介绍、破解信息、安装说明、以及破解组织自己的一些信息。
其余的nfo文件中所包含的信息要少得多,基本可以忽略。
所有这些信息都是英文。
“nfo”来自于单词“information”的第2到第4个字母。
nfo文件的作用现在很清楚了,基本就是这些。
名叫file_id.diz的文件记录了该软件包的全名。
这个文件在互联网发展的早期曾发挥过一定的作用,现在已经基本让位于nfo文件,保留它完全是出于一种习惯,或者说保持向前兼容吧。
nfo文件和file_id.diz的格式是一样的,都是纯文本文件。
要查看他们的内容,用写字板之类的文本编辑器就可以了。
不过,多数情况下大家用写字板打开nfo文件的时候,都会看到很多乱码,这是什么原因呢?要回答这个问题,必须对扩展ASCII有所了解。
扩展ASCII共有256个字符,其中0到7f包括了大部分我们常用的字符,如字母、符号等。
而80及以上的字符并不常用到,其中的一部分被用作制表符。
通常情况下,中文系统用2个ASCII字符合起来表示一个汉字。
但为了不和常用字符冲突,中文系 统用的是80及以上的字符。
但问题在于这些字符也包括了制表符等。
所以 以前的汉字系统经常有汉字识别的问题。
NFO里不仅用到了7f以下的字符, 还大量用到了制表符和非标准换行符。
所以如果我们打开一个NFO,经常可以看到所谓的乱码,就是这个原因!这种现象在非英文的操作系统里尤其普遍。
那么为了正常查看nfo文件的内容,我们需要专用的nfo查看工具。
其实现有的nfo查看工具和普通的文本编辑器并没有很多本质上的不同,只是它们使用标准英文字体来显示文件!借助于它们我们可以正确地看到NFO文件的内容,但是如果nfo文件中有汉字,我们看到的将是乱码。
如果只想看到nfo文件中的文字信息,用任何一种文本编辑器打开它都可以。
如果想看到nfo文件的真面目,最好用专门的工具。
这样的工具现在有很多,网上随便搜一下都可以搜除很多种。
这里我们推荐一种:DAMN_NFO_Viewer_v2.10.0031_Setup.exe在网上可以找到。
如果你经常使用Total Commander这个工具,那么可以在网上搜索它的一个插件nfoviewer,这样用起来会更方便一些。
如果实在找不到或不愿意去寻找专门的工具,也还有一个办法。
那就是使用dos或windows系统自带的文本编辑工具edit。
在dos命令提示符下输入edit即可。
转载请注明出处51数据库 » libsvm软件包介绍