大模型如何重塑城市?清华-MIT发布智能规划新框架

清华-MIT团队提出LLM驱动的智能城市规划框架,实现“概念-生成-评估”全流程人机协同,革新城市设计,共创宜居未来。

原文标题:研究成果 | 清华-MIT联合团队在Nature子刊《自然·计算科学》上发文,提出大语言模型驱动的城市规划新范式

原文作者:数据派THU

冷月清谈:

面对传统城市规划在应对日益复杂的城市系统和多元化社会需求方面的瓶颈,清华大学与麻省理工学院等顶尖机构的联合团队,在《自然·计算科学》上提出了一种由大语言模型(LLM)驱动的智能城市规划新范式。该框架旨在将AI的强大计算、推理与生成能力与人类规划师的专业经验及创造力深度融合,共同应对现代城市规划的挑战,开启人机协同的新篇章。

文章指出,传统规划方法仍受限于规划师中心制、公众参与不足及定性评估等问题。而大语言模型凭借其强大的知识整合、逻辑推理及多模态生成能力,为此带来了突破性机遇。研究团队提出的闭环框架包含概念设计、方案生成和效果评估三个核心阶段,并由大语言模型、视觉大模型(VLM)和LLM智能体协同驱动。

在概念设计阶段,LLM作为跨学科的“规划顾问”,能与规划师进行多轮对话,整合多领域知识,生成创新性概念和初步空间构想草图。方案生成阶段则利用VLM将这些抽象的文本概念转化为具体的、可视化的城市设计方案,如土地利用布局、建筑轮廓,甚至逼真的三维城市场景。效果评估阶段引入LLM智能体构建“虚拟城市”,模拟不同人口统计学特征的居民行为,从而量化评估方案在交通距离、设施使用率、碳排放和社会公平性等方面的潜在影响,为规划方案的迭代优化提供科学、前瞻性的反馈。

初步验证实验显示,LLM在专业考题上表现超越部分人类专家,LLM智能体模拟的热点区域也与真实人群流动数据高度吻合,展现了其巨大潜力。该框架强调建立一种人机协同的新工作流,让人类规划师从繁琐的数据处理和绘图工作中解放出来,更专注于创新、伦理考量以及与各方利益相关者的沟通。同时,团队也坦承面临着高质量城市设计数据稀缺、巨大的计算资源需求和模型中潜在地理社会偏见等挑战,并呼吁未来在建立开放数据平台、开发更高效专用模型和设计公平性算法方向进行深入研究,以期构建更高效宜居、可持续的未来城市。

怜星夜思:

1、文章提到了大模型可能会有地理和社会偏见。在你们看来,如果AI规划出来的城市对某些特定群体不公平,具体可能会导致哪些方面的问题?我们普通市民能做些什么来参与监督或避免这种偏见的产生呢?
2、报告里说AI是助攻,不是要取代人类规划师的。但想知道大家觉得,未来我们城市的规划师具体会做哪些事情?那些特别专业又很具创意性的活儿,AI能帮上多少忙?还有啊,如果我住的房子、走的街道是AI‘设计’的,大家能接受吗?会不会觉得很冷冰冰?
3、文章里说城市规划需要大量高质量数据,同时又要避免AI的潜在偏见。那么,收集这些数据的时候,怎么才能在方便AI规划城市的同时,又保护好咱们老百姓的个人隐私呢?大家觉得哪些数据是AI规划城市最需要的,但又最容易触碰到隐私红线的?

原文内容

图片

面对日益复杂的城市系统和多元化的社会需求,传统城市规划方法正遭遇瓶颈。如今,人工智能(AI)正为这个古老而重要的领域带来颠覆性的革新。


近日,由清华大学电子工程系城市科学与计算研究中心、建筑学院与麻省理工学院(MIT)感知城市实验室、美国东北大学等顶尖机构的学者组成的跨学科团队,在国际前沿期刊《自然·计算科学》上发表观点文章,首次系统性地提出了一个由大语言模型(LLM)驱动的智能城市规划框架。该框架将AI的强大计算、推理与生成能力,同人类规划师的专业经验与创造力深度融合,旨在将AI打造为人类的“智能规划助手”,共同应对现代城市规划中的复杂挑战,为实现更高效、创新和响应迅速的城市设计流程,开启了人机协同的新范式。




城市规划的演进与瓶颈

城市规划的理论与实践在不断发展,从早期侧重物理空间和美学形态的“艺术设计”,演变为二战后将其视为复杂系统,并采用科学模型分析的“科学规划”。然而,这些方法在今天面临着新的挑战:一方面,规划过程仍以规划师为中心,公众参与的广度和深度有限;另一方面,规划方案的评估往往是定性、主观且滞后的,难以进行科学的量化决策和快速迭代。


近年来,以生成对抗网络(GANs)和强化学习(RL)为代表的传统AI模型开始应用于城市规划,在生成街道网络、功能分区等方面展现了潜力。但这些模型通常是为特定任务设计的,知识面狭窄,难以应对现代城市规划与日俱增的跨学科复杂性。大语言模型(LLM)的出现,以其强大的知识整合、逻辑推理和多模态生成能力,为突破这一瓶颈带来了历史性机遇。


LLM驱动的城市规划新流程

针对传统方法的不足,研究团队创新性地提出了一个包含概念设计(Conceptualization)、方案生成(Generation)和效果评估(Evaluation)三个核心阶段的闭环框架。该框架由大语言模型、视觉大模型(VLM)和大模型智能体(LLM Agent)协同驱动,为人类规划师提供全流程的智能辅助。


图1:提出的大语言模型驱动的城市规划框架。该框架整合LLM、VLM和LLM智能体,形成“概念-生成-评估”的协同工作流。


  1. 概念设计:LLM成为拥有跨学科知识的“规划顾问”

在规划初期,规划师输入需求、约束和指导方针等文本信息。经过海量数据预训练的LLM,能够深度整合地理、社会、经济等多领域知识,与规划师进行多轮“对话”。它不仅能提出创新性的概念想法,还能根据复杂的上下文进行推理,生成详细的规划描述文本和初步的空间构想草图,极大地提升了概念设计阶段的效率和深度。


图2: 基于LLM的城市概念设计流程图


  1. 方案生成:VLM化身“视觉设计师”,将文字转化为蓝图

该框架利用视觉大模型(VLM)将抽象的文本概念转化为具体的、可视化的城市设计方案。规划师可以通过文本指令(Prompt)精确描述规划概念和约束条件,经过城市设计数据微调的VLM能够生成精细的视觉输出,如土地利用布局、建筑轮廓,甚至是逼真的三维城市场景,同时还能确保设计符合地理等现实约束。


图3:城市方案生成示意图


  1. 效果评估:LLM智能体构建“虚拟城市”,预演未来生活

为了对规划方案进行科学评估,框架引入了LLM智能体进行城市动态模拟。研究人员为智能体设定不同的人口统计学特征(如年龄、职业),让它们在生成的虚拟城市中模拟居民的日常出行、设施使用等活动。通过分析这些模拟行为,可以得到关于交通距离、设施使用率、碳排放、社会公平性等多维度的量化评估指标,为规划方案的迭代优化提供科学、前瞻性的反馈。


图4:基于LLM&VLM智能体的城市规划效果评估方案



初见成效:AI展现超越人类专家的潜力

为验证该框架核心能力的可行性,清华大学电子系城市科学与计算研究中心持续发布CityGPT、CityBench、 UrbanLLaVA等系列语言视觉跨模态城市大模型及UrbanWord、EmbodiedCity、AgentSociety等城市具身仿真平台与社会模拟系统,为大模型时代的城市规划与社会治理奠定了技术基础。针对LLM时代的城市规划,研究团队进行了一系列概念验证实验。在一项测试中,研究者让LLM回答城市规划师专业资格考试的题目,结果显示,最大规模的LLM在回答复杂规划概念问题上的表现,超过了排名前10%的人类规划师,证明了其在概念化阶段的巨大潜力。


在评估阶段的模拟测试中,团队利用LLM智能体在美国纽约和芝加哥的两个社区中模拟居民的设施访问行为。模拟结果显示,智能体访问的热点区域与真实的居民流动数据高度吻合,证明了LLM智能体在预测规划方案实际影响方面的准确性和有效性。


图5:LLM生成城市规划效果示意图



挑战与展望:构建人机协同的未来城市

研究团队最后强调,这一框架并非要取代人类规划师,而是旨在建立一种人机协同的新工作流。在这种模式下,规划师可以从繁琐的数据处理和绘图工作中解放出来,更专注于创新、伦理考量以及与各方利益相关者的沟通,而AI则负责高效地完成概念整合、方案生成和模拟评估。


同时,文章也指出了该技术路线面临的挑战,包括高质量城市设计数据的稀缺性、巨大的计算资源需求,以及模型中潜在的地理和社会偏见等。未来的研究需要建立开放的数据平台,开发更高效的专用模型,并设计公平性算法,确保AI技术能够公平、包容地服务于所有城市环境。


我们可以期待在不久的将来,城市规划师借助强大的AI助手,能够更快、更好地设计出高效宜居、可持续的城市,充分释放人类的创造力来塑造我们共同的城市家园。


论文链接:https://www.nature.com/articles/s43588-025-00846-1



作者介绍

该论文第一作者为清华大学电子工程系博士生郑瑜,通信作者为清华大学电子工程系李勇教授、清华大学建筑学院林雨铭助理教授以及美国东北大学环境工程系Qi R. Wang副教授。合作者包括清华大学电子系的徐丰力助理教授,以及MIT感知城市实验室的Paolo Santi研究员和Carlo Ratti教授。




关于我们

数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军




新浪微博:@数据派THU

微信视频号:数据派THU

今日头条:数据派THU


针对“AI偏见导致的问题”:从社会公平性角度看,AI模型如果基于偏颇数据训练,可能会在资源分配、基础设施建设上加剧现有社会不平等。例如,针对特定经济水平或民族聚居区,基础设施投入可能不足,公共服务可达性差,甚至导致“数字贫民窟”的出现。这违反了城市规划的基本伦理原则——为所有人创造公平、宜居的环境。

哈哈,AI偏心?那我岂不是有可能被“规划”到一个没有烧烤摊的社区!开玩笑啦。但正经说,最怕的就是它把我们平时不起眼的“角落群体”给忘了,比如行动不便的老人,或者夜晚工作的外卖小哥。可能停车场只考虑私家车,不考虑快递车停放;或者盲道设计得稀烂。我们能做的就是——“用脚投票”!或者说,用键盘批评,用实际行动去“打破”它那些不合理的设计,让它的数据模型知道它错了!毕竟,城市是给人住的,不是给AI跑数据的。

哎呀,这确实是个大挑战!总不能把我家门口有没有晾内裤这种信息也给AI吧?我觉得最重要的就是“分级”和“授权”。比如,人口密度、公共交通客流、区域功能分布这种宏观数据,可以公开一些。但涉及个人精确行踪、消费习惯、甚至家里的水电用量这些,就一定要征得我的同意,而且用途要明确,不能滥用。最容易踩雷的肯定是个人出行数据和个人消费习惯数据,这些能精确勾勒出一个人画像,感觉很危险。希望政府和科技公司能开发出让我能清楚看到我的数据被怎么用,并且可以随时撤回授权的机制。

数据!数据!现在什么都想要数据,但我可不想每天被AI盯着看我去了哪里、吃了什么!保护隐私最简单粗暴的就是——少收集点!或者只用“粗颗粒度”的数据,比如某个区域有多少人,而不是具体某个人在干嘛。最容易触碰隐私红线,那肯定是精准定位和行为模式分析啊,那不就等于在我身上安了个摄像头?就算它说匿名化,谁知道会不会一不小心就被交叉识别出来了。所以,别给我画什么“用户画像”了,留点神秘感不好吗?

哇,这个问题触碰到我了。AI辅助规划师,我觉得挺好的,可以提高效率。但规划师的核心价值还在于理解“人”和“社会”,这种人文理解、对于历史文脉的尊重、对社群情感的感知,AI可能很难替代。创意方面,AI能生成“完美”方案,但那种带着缺憾美、生活温度和当地文化韵味的“不完美”,才是城市魅力的来源。如果我住的街道都是AI设计,我可能会担心它太“理性”、“优化过度”,会不会缺少一些惊喜和偶然性,让我觉得街道少了点“人情味”?希望只是助手,‘最终拍板’的还是人。

我觉得AI肯定能让规划师“更有趣”!那些画图、算容积率、分析交通流量的苦活累活就交给AI去干呗。规划师就能有更多时间去跑社区,跟居民聊天,听听大家对公园、学校、交通的真实想法。创意方面,AI可以“脑洞大开”提供N种方案,规划师再从中挑选和调整,注入人文关怀。我想住AI设计的房子啊!只要它能保证我住得舒服,出行便利,环境优美,谁设计的又有什么关系呢?高科技嘛,期待!

要平衡数据需求与隐私保护,关键在于数据的“脱敏化”和“联邦学习”等技术应用。首先,需对原始数据进行严格的匿名化、假名化处理,移除个人身份标识。其次,可采用联邦学习等去中心化技术,让AI在本地设备上训练模型,只上传模型参数而非原始数据。法律层面,完善数据安全和隐私保护法规,明确数据使用边界和责任,设立独立的数据伦理委员会进行监督。最容易触碰隐私红线的数据包括:个人精确位置轨迹、详细的人口统计学信息(如收入、健康状况)、社交互动数据等。这些数据对分析城市活力和需求至关重要,但其敏感性要求最高级别的保护。

关于未来规划师的角色,我认为他们将更侧重于宏观战略引导、价值判断和复杂利益协调。AI可以高效完成数据分析、模式识别、方案生成及模拟评估等重复性、计算密集型工作。人类规划师则能将精力聚焦于确定城市发展的愿景、与多元主体沟通达成共识、处理伦理与文化敏感性问题,以及进行创新性的空间叙事。AI在创意性方面能提供大量的灵感和可能性,但最终将这些元素整合并赋予人文温度,仍是人类不可替代的价值。至于AI设计,如果它能带来更高效、人性化的城市体验,公众接受度会逐渐提高,关键在于“体验”而非“谁设计”。

这个问题问得好!AI要是偏心,最直接的就是咱们老百姓生活不方便。比如给富人区盖更多公园,穷人区连公交车站都少;或者数据里女性通勤数据少,导致规划出来的公交线路对女性不友好。我们普通人能做的就是多发声啊!比如参与社区听证会,利用社交媒体反映问题,还可以联合起来要求政府公开AI规划的决策依据和数据来源,甚至是推动建立第三方机构来评估AI规划的公平性。