如果缺失值只占数据的5%不到,那么缺失值对数据的影响不大,各种缺失处理方式差异不大,简单点处理就好,比如均值填补,或者索性直接删除有缺失的个案,但均值填补无法利用缺失数据里面可能含有的有效信息,而删除个案有可能导致对数据的结构产...
(一)个案剔除法(listwise deletion) 最常见、最简单的处理缺失数据的方法是用个案剔除法(listwise deletion),也是很多统计软件(如spss和sas)默认的缺失值处理方法。 在这种方法中如果任何一个变量含有缺失数据的话,就把相对应的个案从分析。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
| 文章分类: |
|
还能输入300字
上传中....
LEO64270262