数据挖掘在公交调查数据分析中的应用研究.pdf
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 挖掘 公交 调查 分析 中的 应用 研究
- 资源描述:
-
第39卷,第2期
公路工程
2014年4月
Highway Engineering
Apr.,2014
数据挖掘在公交调查数据分析中的应用研究
刘昱岗,安冬冬
(西南交通大学交通运输与物流学院,四川成都610031)
[摘要]针对公交调查数据背后信息挖掘的需求,论文首先介绍了公交调查数据挖掘的理论概念及任务方
法。概述了公交调查数据挖掘的常规沆程,并且在分析了几种公交调查数据挖掘模型建模方法的基础上,得出k-
means模型最适宜对公交调査数据进行聚类分析。最后以达州市公交调査数据为样本实例,采用年龄、职业、每周
乘坐公交天数、每月公交花费、偏好付款方式等几种属性,借以 SPSS Clementine为软件平台、以k- means为模型对
各属性数据进行聚类分析,软件运行后得到相似度较大的几组类别,根据不同样本含量的几组聚类进行图表分析
分别得出优化公共交通服务的相应建议,达到最初挖掘公交调查数据背后信息的目的。
[关键词]城市交通;数据挖掘;聚类分析;公交调査数据; SPSS Clementine
中图分类号]U492.4“3[文献标识码]A
[文章编号]1674-0610(2014)02-0096-06
An Application of Data-mining with Bus Survey Data
LIU Yugang, AN Dongdong
(School of Transportation and Logistics, Southwest Jiaotong University, Chengdu, Sichuan 610031, China)
L Abstract] According to the need of mining information behind bus survey data, this paper mainly
discusses the data mining technology in the application of bus survey data. First the paper introduces the
theoretical concepts and tasks of data mining methods, summarizes the conventional process of data min
ing, and then on the bases of analysis the modeling methods of several data mining models, we find k-
means is the most suitable model for bus survey data clustering analysis; paper also uses Dazhou bus sur-
vey data for instances, with age, job, days per week, cost per month, type of payment, and uses SPSS Cle
mentine as a platform and k-means as a model for data clustering analysis, obtains larger similarity of sev-
eral groups of categories, and carries on the chart analysis, get corresponding suggestions of optimizing bus
service, achieve the objective of the initial information hidden in transit survey data
Key words] urban traffic; data mining; clustering analysis; bus survey data; SPSS Clementine
1概述
客流量预测等领域均有一定发展,本文即是采用数
据挖掘理论模型对公交调査数据进行分析,得出提
在国家“公交优先”政策和发展公交一体化城高公交运行效率和服务质量的建议
市的背景下,公共交通已成为城市交通的主要组成
部分,公交调查数据作为公交运营状况及服务质量2公交调查数据挖掘简述
的反馈信息,对公交运营及时调整发车频率、增加线2.1概念
路条数、线路班车数、延长线路运营时间等均有实质
数据挖掘就是从大量的、不完全的、有噪声的、模
性的作用,在城市进行公交发展规划中也很强的指糊的、随机的实际应用数据中,提取隐含在其中的、人
导性。如何从一张公交调査表中得到有用的信息,们事先不知道的、但又是潜在有用的信息和知识的过
以及以怎样的分析结论对下一阶段的公交运营进行程叫。它并不是在大量已有数据的基础上发明创造,
改进是值得研究的。近年来,数据挖掘理论模型作而是一个数据收集、分析、归纳总结的过程,故而又称
为一种有效工具在客户分类、客户流失预测和交通为数据库中的知识发现】。在本篇文章中主要体现
[收稿日期]2013-05-27
[基金项目]四川省科技支撑计划项目(2010ZR0021);西华大学重点实验室开放基金项目(编号SZj2011-033)
作者简介]刘昱岗(1978-),男,湖南邵阳人,副教授,硕土生导师,主要从事交通运输管理研究与教学工作。
展开阅读全文
文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
关于本文