用导入的方法比较简单,示例代码如下:proc import out=t1;datafile="d:\test.xls"dbms=excel2000 replace;range=''14#1contentquot;;getnames=yes;run;(2)用逻辑库和引擎的方法代码也很简单:libname tests excel 'D:\tests.xls';(3)用ACCESS的过程:proc access dbms=xls2000;
create work.s0001.access;
path='D:\test.xls';
getnames yes;
select data all;list view;run;简单解释一下上面的语句:用access并不是把数据文件真正的读入到sas中来,而是先建立一个数据访问描述器create work.s0001.access,用来描述sas对数据库的访问,之后建立一个视图create work.s001.view;视图和sas里的数据文件也不一样,相当于一个查询。用access方法访问数据库的好处是不占用硬盘空间,特别是数据文件特别大时,不需要把文件全部读入就可以进行数据访问,同时数据操作的结果也可以写回到数据库中。(4)odbc的方法:先手工在控制面板里,新建用户dsn,创建相应数据类型的数据源;然后再sas的资源管理器里,手工新建逻辑库odbc。
如果跟踪sas系统自带的import wizard的输出代码,对于选定字段的读入,如果是固定字段长的,会直接跳过不选的字段;但是对于间隔文本如csv等,都是先读入,后用keep/drop来筛选。这是sas厂家的标准做法。
这个不会有太大的效率问题,因为仅仅是读入量增大,写出的数据量并不会增大。
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....