回归分析中所涉及的变量常分为自变量与因变量。 当因变量是非时间的连续性变量(自变量可包括连续性的和离散性的)时,欲研究变量之间的依存关系,进行可以多元线性回归分析。
研究者根据专业知识和经验所选定的全部自变量并非对因变量都是有显著性影响的,故筛选变量是回归分析中不可回避的问题。介绍最常用的一种变量筛选法——逐步筛选法。
模型中的变量从无到有,根据F统计量按SLENTRY的值(选变量进入方程的显著性水平)决定该变量是否入选;当模型选入变量后,再根据F统计量按SLSTAY的值(将方程中的变量剔除出去的显著性水平)剔除各不显著的变量,依次类推。这样直到没有变量可入选,也没有变量可剔除或入选变量就是刚剔除的变量,则停止逐步筛选过程。
例题:
α-甲酰门冬酰苯丙氨酸甲酯(FAPM)是合成APM的关键中间体之一。试验表明,影响FAPM收率的主要因素有∶ 原料配比(r)、溶剂用量(p1)、催化剂用量(p2)及反应时间(t)等4个因素,现将各因素及其具体水平的取值列在下面。
影响FAPM合成收率的因素和水平∶
因素各水平的代码 1 2 3 4 5 6 7
r 原料配比 0.80 0.87 0.94 1.01 1.08 1.15 1.22
p1 溶剂用量(ml) 10 15 20 25 30 35 44
p2 催化剂用量(g) 1.0 1.5 2.0 2.5 3.0 3.5 4.0
t反应时间(h) 1 2 3 4 5 6 7
研究者按某种试验设计方法选定的因素各水平的组合及其试验结果如下,试用回归分析
方法分析此资料(注∶权重仅为相同试验条件下重复实验运行的次数)。
编号 r p1 p2 t Y(收率,%) 权重
1 0.80 15 2.0 6 71.5 3
2 0.87 25 3.5 5 71.2 2
3 0.94 35 1.5 4 72.8 3
4 1.01 10 3.0 3 69.7 2
5 1.08 20 1.0 2 67.5 3
6 1.15 30 2.5 1 67.3 3
7 1.22 40 4.0 7 71.8 3
具体计算特麻烦,必须借助统计软件。
MODEL y=r r2 p1 p12 p2 p22 t t2 rp1 rt p1t / SELECTION=STEPWISE;筛选变量。
有的
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....