实验08 聚类分析
时间:2023-01-01 18:30:00
实验08 聚类分析
一、实验目的
完成作业,学会聚类分析方法
二、实验内容
做2008年房价聚类
三、准备实验数据
2008年,中国31个省、市、自治区房地产行业的相关统计数据。有X1.平均房屋销售价格;X二、住宅平均销售价格;X三、别墅、高档公寓平均销售价格;X4.经济适用房平均销售价格;X5:办公楼平均销售价格X6:商品房平均销售价格;X7:其他平均销售价格;X八、商品房销售面积;X九、住宅销售面积。这些变量
四、实验过程
(一)SAS程序
①最长距离法
data examination;
input province$x1-x9@@;
cards;
北京 12418 11648 19541 3813 16554 17148 6416 1335.37 1031.43
天津 6015 5598 11107 3571 9783 10338 9195 1252.04 1135.35
河北 2779 2743 6375 2208 3692 3915 2102 2231.84 2128.86
山西 2355 2253 5741 1466 6115 2867 2545 994.71 893.10
内蒙古 2483 2265&bsp; 4104 1690 4822 4080 2660 2396.37 2093.34
辽宁 3758 3575 7265 2095 4783 6149 3888 4091.16 3731.19
吉林 2507 2399 6175 1932 3256 3687 3213 1583.87 1435.73
黑龙江 2832 2642 5414 1785 2804 4330 3019 1486.57 1286.62
上海 8195 8115 12792 1847 11783 6610 5529 2339.29 2007.48
江苏 4049 3802 7729 1922 5906 6172 2567 6091.86 5282.89
浙江 6262 6144 9424 3092 9716 7446 3180 2992.2 2480.74
安徽 2949 2808 4058 1731 4596 4627 2139 2785.83 2542.6
福建 4384 4498 7334 2313 5386 8303 1686 1625.67 1250.00
江西 2136 2022 3141 1098 2840 4039 2057 1727.6 1604.86
山东 2970 2851 7256 1826 5601 4601 2440 5507.64 5039.4
河南 2339 2138 3618 1372 4367 5065 1933 3191.98 2943.36
湖北 3001 2898 6191 1900 5122 4863 3513 1941.62 1821.31
湖南 2302 2113 4007 1388 4212 4564 1969 2655.51 2413.7
广东 5953 5723 6817 2380 10554 8630 5296 4852.28 4360.45
广西 2826 2634 4601 1880 4959 6077 2926 1768.04 1637.99
海南 5443 5441 9058 1686 5831 5461 5157 372.44 358.72
重庆 2785 2640 6322 1751 4667 5432 2489 2872.19 2669.93
四川 3157 3067 7934 1266 5688 4528 2397 3501.27 3247.32
贵州 2339 2122 4738 1926 3672 5967 2935 908.2 848.11
云南 2680 2441 3230 1441 4860 5203 3086 1643.08 1478.25
西藏 3202 3103 3547 2133 10000 4554 1200 66.49 62.08
陕西 2952 2821 5589 1691 5571 5056 3149 1513.01 1426.06
甘肃 1958 1851 2082 1264 2899 4008 2134 624.66 588.63
青海 2460 2384 2768 1214 3271 4246 2625 147.89 141.23
宁夏 2435 2215 5345 1447 3726 4243 1570 514.81 453.26
新疆 2240 2100 3684 1333 5184 4156 2434 954.35 886.35
;
proc print data=examination;
run;
proc distance data=examination out=Distance method=gower shape=square;
var interval(x1-x9);
run;
proc cluster data=examination method=com outtree=tree;
id province;
var x1-x9;
proc tree horizontal;
id province;
run;
②类平均聚类法
data examination;
input province$x1-x9@@;
cards;
北京 12418 11648 19541 3813 16554 17148 6416 1335.37 1031.43
天津 6015 5598 11107 3571 9783 10338 9195 1252.04 1135.35
河北 2779 2743 6375 2208 3692 3915 2102 2231.84 2128.86
山西 2355 2253 5741 1466 6115 2867 2545 994.71 893.10
内蒙古 2483 2265 4104 1690 4822 4080 2660 2396.37 2093.34
辽宁 3758 3575 7265 2095 4783 6149 3888 4091.16 3731.19
吉林 2507 2399 6175 1932 3256 3687 3213 1583.87 1435.73
黑龙江 2832 2642 5414 1785 2804 4330 3019 1486.57 1286.62
上海 8195 8115 12792 1847 11783 6610 5529 2339.29 2007.48
江苏 4049 3802 7729 1922 5906 6172 2567 6091.86 5282.89
浙江 6262 6144 9424 3092 9716 7446 3180 2992.2 2480.74
安徽 2949 2808 4058 1731 4596 4627 2139 2785.83 2542.6
福建 4384 4498 7334 2313 5386 8303 1686 1625.67 1250.00
江西 2136 2022 3141 1098 2840 4039 2057 1727.6 1604.86
山东 2970 2851 7256 1826 5601 4601 2440 5507.64 5039.4
河南 2339 2138 3618 1372 4367 5065 1933 3191.98 2943.36
湖北 3001 2898 6191 1900 5122 4863 3513 1941.62 1821.31
湖南 2302 2113 4007 1388 4212 4564 1969 2655.51 2413.7
广东 5953 5723 6817 2380 10554 8630 5296 4852.28 4360.45
广西 2826 2634 4601 1880 4959 6077 2926 1768.04 1637.99
海南 5443 5441 9058 1686 5831 5461 5157 372.44 358.72
重庆 2785 2640 6322 1751 4667 5432 2489 2872.19 2669.93
四川 3157 3067 7934 1266 5688 4528 2397 3501.27 3247.32
贵州 2339 2122 4738 1926 3672 5967 2935 908.2 848.11
云南 2680 2441 3230 1441 4860 5203 3086 1643.08 1478.25
西藏 3202 3103 3547 2133 10000 4554 1200 66.49 62.08
陕西 2952 2821 5589 1691 5571 5056 3149 1513.01 1426.06
甘肃 1958 1851 2082 1264 2899 4008 2134 624.66 588.63
青海 2460 2384 2768 1214 3271 4246 2625 147.89 141.23
宁夏 2435 2215 5345 1447 3726 4243 1570 514.81 453.26
新疆 2240 2100 3684 1333 5184 4156 2434 954.35 886.35
;
Proc Cluster Data = examination Method = average std;
ID province;
Var x1-x9;
Proc Tree horizontal;
Run;
③最小距离法
data examination;
input province$x1-x9@@;
cards;
北京 12418 11648 19541 3813 16554 17148 6416 1335.37 1031.43
天津 6015 5598 11107 3571 9783 10338 9195 1252.04 1135.35
河北 2779 2743 6375 2208 3692 3915 2102 2231.84 2128.86
山西 2355 2253 5741 1466 6115 2867 2545 994.71 893.10
内蒙古 2483 2265 4104 1690 4822 4080 2660 2396.37 2093.34
辽宁 3758 3575 7265 2095 4783 6149 3888 4091.16 3731.19
吉林 2507 2399 6175 1932 3256 3687 3213 1583.87 1435.73
黑龙江 2832 2642 5414 1785 2804 4330 3019 1486.57 1286.62
上海 8195 8115 12792 1847 11783 6610 5529 2339.29 2007.48
江苏 4049 3802 7729 1922 5906 6172 2567 6091.86 5282.89
浙江 6262 6144 9424 3092 9716 7446 3180 2992.2 2480.74
安徽 2949 2808 4058 1731 4596 4627 2139 2785.83 2542.6
福建 4384 4498 7334 2313 5386 8303 1686 1625.67 1250.00
江西 2136 2022 3141 1098 &nb