看你的代码的话,BY在里面的作用是起到分组的作用,也就是PROCESSING BY -GROUP。即会根据你进行分组的变量就是分组,比如YEAR这个变量,当你BY YEAR后其实相当于你对YEAR这个变量进行了分组设置,这时候会产生两个类似指针的东西,FIRST和LAST。FIRST.YEAR和LAST.YEAR用来分别标识YEAR变量里面的值的分组情况FIRST.YEAR为1到其最近的一个LAST.YEAR为1是为一组。
一般要进行组操作的时候使用该方式
下面的程序需要注意的是,由于date变量是非标准变量,也就是没有year,所以我直接作为字符型录入进来了,这样的date变量是无法计算的,如果数据分析不涉及date计算,就没有什么影响了。
data test;
length region $14;
input region $ date $ ret;
datalines;
anhuiaaaaaaaaa jul-01 -0.144361702
anhui aug-01 -0.0317256
anhui sep-01 -0.038598136
anhui oct-01 -0.040128642
anhui nov-01 0.031369225
anhui dec-01 -0.0418267
anhui jan-02 -0.073468155
anhui feb-02 0.011106317
;
run;
Hadoop|
Apache Pig|
Apache Kafka|
Apache Storm|
Impala|
Zookeeper|
SAS|
TensorFlow|
人工智能基础|
Apache Kylin|
Openstack|
Flink|
MapReduce|
大数据|
云计算|
用户登录
还没有账号?立即注册
用户注册
投稿取消
文章分类: |
|
还能输入300字
上传中....