您当前的位置：首页 > 计算机 > 软件应用 > 采集运算

使用IBM SPSS Statistics的最近邻元素模型进行数据分析！

时间：08-17来源：作者：点击数：

SPSS的最近邻元素分析是一种分类模型，它是根据个案间的相似性来对个案进行分类。简单来说就是相同个案相互靠近，不同个案相互远离。因此，可以通过判断样本距离哪个离中心点更近，进而判断样本数据属于哪个类别。本篇教程将教大家使用SPSS的最近邻元素模型对汽车行业数据进行数据分析，相信通过学习SPSS的最近邻元素模型，你将能够对各个领域数据分析。

一、数据准备与数据预处理

为了用最近邻元素模型给大家演示数据分析，这里使用Kaggle实验室的car_sales数据集。主要通过添加两款新研制的车型进行数据分析，这两款预研车型技术指标主要包括Model、Priceinthousands、enginesize、horsepower、width、length、curbweight、fuelcapacity、fueleffciency等。

图1数据展示

图1数据展示

为了对这款新研发的车型进行分析，这里在原数据添加这两个车型的新记录。

图2新增记录

图2新增记录

为了对新记录添加特别关注的标记，因此这里将添加一个名为focal的新变量。点击SPSS顶部菜单栏“转换”-“计算变量”，打开计算变量窗口，目标变量命名为focal，并在数字表达式输入any(Model,'newCar','newTruck')。这个函数表达式意思是Model变量值为'newCar'或者'newTruck'，则focal为1，否则为0.

图3新增变量focal

图3新增变量focal

同样通过计算变量方式添加变量partition，用于区分训练数据集和测试数据集，表达式为1-any(Model,'newCar','newTruck')。Partition>0，则为训练数据，否则为测试数据。

图4新增变量partition

图4新增变量partition

二、最近邻元素模型分析

由于篇幅有限，这里仅展示预估汽车类型。点击SPSS顶部菜单栏“分析”-“分类”-“最小邻元素”。点击顶部“变量”项目进行设置，将vehicletype加载到目标文本框，9个指标加载到特征文本框，focal加载到焦点个案，Model加载到个案标签。

图5最近邻元素分析

图5最近邻元素分析

点击最近邻元素分析顶部“邻元素”，将k值设置为3，并且勾选计算距离时按重要性对特征进行加权。

图6邻元素

图6邻元素

点击最近邻元素分析顶部“分区”，训练和坚持分区选择使用变量来分配个案，并且将partition加载到分区变量文本框。

图7分区

图7分区

三、结果分析

可以看到对于预估汽车类型结果，数据添加了一个预测值的变量，可以看到对新车的预测比较准确，并且生成了一个预估变量空间图型。

图8预估结果

图8预估结果

四、小结

以上是利用SPSS最近邻元素模型对汽车行业数据进行分析，相信通过从数据准备和预处理，再到利用最近邻元素模型分析，最后到结果分析，你已经对该模型有一定了解，并且能够简单使用到各个领域。

方便获取更多学习、工作、生活信息请关注本站微信公众号 城东书院微信服务号

城东书院微信服务号

城东书院微信订阅号

上一篇:怎么使用IBM SPSS Statistics给数据做交叉相关性分析！下一篇:SPSS医药应用解决方案

推荐内容

高考生入学注意：这些大	【健康】纯净水、天然
14种竞赛生升学路径盘	excel后缀xls和xlsx有

相关内容

栏目更新

栏目热门

关于我们 | 联系我们 | 用户协议 | 广告服务 | 申请链接 | 网站地图 | 版权声明 | 用户留言 | 招聘信息 | 帮助中心 | 社区讨论 | 下载服务

中国文明网传播文明

Copyright ©2019-2024 CDSY Corporation, All Rights Reserved

城东书院^® CDSY.XYZ 版权所有湘ICP备19021508号-1 公安网备案

公安网备案

湘公网安备 43102202000103号

※学习、工作、生活信息平台※

本网大部分资源来源于会员上传，除本网组织的资源外，版权归原作者所有，如有侵犯版权，请立刻和本网联系并提供证据，本网将在三个工作日内改正。