清华大学大数据能力提升项目成果展:故宫游客行为研究

清华大数据项目学生利用GPS轨迹数据分析故宫游客行为,研究成果助力建筑空间设计和环境设施配置。

原文标题:大数据能力提升项目|学生成果展系列之二

原文作者:数据派THU

冷月清谈:

清华大学大数据能力提升项目旨在培养具备大数据思维和应用创新能力的跨学科人才。项目整合课程模块,形成大数据思维与技能、跨界学习、实操应用相结合的课程体系及线上线下混合式教学模式。

2024年的项目成果丰硕,学生将数据科学应用于各自专业领域,展现了交叉复合型创新人才的培养成果。

建筑学院王露莹同学参与的“故宫观众游览行为与环境感知调查”项目,利用高精度GPS轨迹数据,结合轨迹可视化、数据统计分析、机器学习等方法,深入挖掘故宫观众的时空分布和停留行为特征,并构建了建成环境中轨迹挖掘的方法框架。

该研究已发表多篇论文,其中包括一篇A类国际会议论文,一篇AIR首刊邀稿综述,以及一篇发表在A&HCI一区期刊Frontiers of Architectural Research上的论文。研究成果揭示了游客在自由漫步式观览空间中的停留行为模式,为建筑空间设计和环境设施配置提供了重要启示。

怜星夜思:

1、除了GPS轨迹数据,还可以结合哪些数据更全面地分析游客行为?
2、这项研究成果如何应用于其他类似的场景,例如其他博物馆、主题公园等?
3、研究中提到的“游客一致性停留行为模式”有哪些具体的表现?

原文内容


导读


为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。



回首2024年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自8个院系的8位同学代表一起领略他们的风采吧!




代表性成果




大数据方向代表性成果——
《故宫观众游览行为与环境感知调查》研究工作


建筑学院 王露莹


本人以核心成员身份完整参与“故宫观众游览行为与环境感知调查”项目,并形成一系列大数据环境行为分析研究成果,具体包括:项目报告《基于 GPS 轨迹数据的故宫观众游览行为特征与垃圾箱设置策略研究》,以及 3 篇学术文章分别发表 A 类国际会议、AIR 首刊邀稿、A&HCI 一区期刊(Frontiers of Architectural Research)

本项目利用疫情期间限制流量与开放区域的机会,分多个阶段进行了现场数据采集工作,最大限度减少了外部因素对真实环境下游客行为的影响。获取了大量故宫观众的高精度 GPS 轨迹数据,通过大数据方法中的轨迹可视化、数据统计分析、机器学习等,挖掘了故宫观众在游览过程中的时空分布特征与停留行为特征,同时构建了建筑环境中轨迹挖掘的方法框架。在研究的第一阶段,我于 2022 年把初步研究结果在《CEB-ASC 环境行为研究学会国际会议(原 EBRA 国际会议)》上进行了宣讲,以第一作者发表了题为“基于 GPS 轨迹数据的故宫观众游览与停留行为特征初探”的会议论文。在建筑环境行为研究领域采用的大数据分析方法和创新性成果,引发了出色反响。

随着项目推进,依托轨迹数据对时空行为规律研究的不断探索,我在研究中总结并提出了适用于建成环境研究的轨迹分析方法框架。与此同时,导师接到《Architectural Intelligence》新刊首刊约稿,把相关成果整理成学术文章,以第二作者(导师一作)发表了题为“Towards big data behavioral analysis: rethinking GPS trajectory mining approaches from geographic, semantic, and quantitative perspectives ”的综述性方法验证论文。本篇文章综述了面向人群空间使用行为特征分析的轨迹挖掘方法,理清了交通规划、旅游学、生物基因等领域常用的轨迹/序列挖掘方法在建筑学中的适用场景、应用方式及使用效果,完善了从轨迹挖掘结果指向建筑与场所空间中人群行为特征的逻辑链条,为建筑学科大数据行为研究建立了一套适用的轨迹分析方法框架。截至目前期刊官网被引次数 3、阅读量 3370+。文章同步在期刊公众号《Architectural Intelligence》上线宣传,发 布了题为“ARI 研究文章 | 面向大数据行为分析:地理图形、语义信息和量化指标视角下的 GPS 轨迹挖掘方法再思考”的公众号文章,截至目前阅读量 1000+。

在整个项目中,我使用 Python 算法程序完成了主要数据处理和分析工作,完成了项目结题,并且在此过程中对大数据分析的理解更加深入,意识到大数据分析离不开亲自的观察与实践,才能形成对数据的深刻理解,在统计描述的基础上发掘更加普遍的规律。

因此,在项目结束后,我又深化了研究的分析工作,在 GPS 轨迹大数据中发现了更具有普遍意义的一致性游客行为规律,并以第一作者在建筑研究领域的重要期刊《Frontiers of Architectural Research》(A&HCI 一区前 1%,影响因子 3.5)发表了大数据行为研究论文 “ Visitors'  consistent  stay  behavior patterns within  free-roaming  scenic architectural  complexes:  Considering   impacts  of  temporal,  spatial,  and environmental factors ”。并在研究所众号《黄蔚欣研究室》发布了题为“A 论文 | 自由 漫步式观览建筑群中的游客停留行为模式:考虑时间、空间和环境的影响”的公众号文章,截至目前转发量近 350,阅读量近 3000。

该论文通过分析故宫博物院游客的 GPS 轨迹数据,探讨了自由漫步式观览空间内游客游览过程中的停留行为模式。利用疫情期间短暂开放的机会,最大限度减少了外部因素对真实环境下游客行为的影响,揭示了不局限于特定地点、可推广到类似情境、更本质和具有普遍性的行为规律,并为自由漫步式建筑空间设计和环境设施配置提供了重要的启示和全新的视角。论文中的研究结果为提升各种文化和建筑环境下历史景区的设计和管理提供了有价值的见解。例如,在游览的后期阶段,游客倾向于休息更长时间这一心理时间分配的固定模式,可能对于设计满足游客体力需求的休息空间具有普遍意义。深入了解游客选择特定休息区的一致偏好,可以帮助建筑师设计出既灵活又多功能的空间。


编辑:文婧

校对:林亦霖





关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。



新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


从心理学角度来看,一致性行为模式的出现可能与人们的认知习惯和从众心理有关,在不确定的环境中,人们倾向于模仿他人的行为,这也可能导致游客在游览过程中表现出一些共同的停留行为模式。

关于“游客一致性停留行为模式”,文章中提到了游客在游览后期更倾向于休息更长时间,我觉得这可能是因为体力消耗导致的,也可能是因为游览接近尾声,游客的心态更加放松,更愿意驻足欣赏。

从学术角度来说,可以结合气象数据、节假日安排等外部因素,分析这些因素对游客行为的影响。例如,高温天气是否会影响游客的停留时间,节假日客流量高峰期游客的行为模式是否会发生改变等。

这个研究的思路还可以应用于城市规划和交通管理,通过分析人流的移动轨迹和聚集规律,优化交通路线和公共设施布局,提升城市运行效率。

除了休息时间,我猜想游客在某些特定景点或者展品前的停留时间也可能存在一致性规律,比如一些热门的打卡点,游客通常会停留更长时间拍照留念。

还可以考虑结合社交媒体数据,比如游客在微博、朋友圈等平台发布的关于故宫的图文、视频等,可以分析游客的情感倾向和体验评价,更有助于了解游客的需求。

对于主题公园来说,可以结合游客的游玩项目、排队时间等数据,分析游客的偏好和体验满意度,并针对性地调整运营策略,例如优化排队系统、增加热门项目的接待能力等。

我觉得可以借鉴该研究的分析方法和框架,对其他博物馆、主题公园等场所的游客行为进行研究,例如分析游客的参观路线、停留时间、兴趣点等,从而优化场馆布局和展陈设计。

我觉得可以结合游客的购票信息、游览路线、馆内消费数据等,这样可以更全面地了解游客的兴趣偏好和消费习惯,从而更好地优化景区服务和管理。