当前位置:页面
DailyMobility Generation
针对城市环境中个体出行模式的高度异质性与时空关联性难题,DailyMobility基于北京市真实数据,构建了一个可复现的日常移动行为生成场景。该Benchmark强调在模拟“个体活动半径”“日访问结构”及“出行动机序列”时对人口统计特征和空间分布的保真度要求,为探索LLM智能体在复杂城市场景中生成连贯、可解释的移动轨迹提供了坚实基础,并助力城市科学与智能体模拟交叉研究的深入展开。
评估任务
日常移动行为生成
基于用户特征和城市环境生成符合真实用户行为的日常移动模式
输入:
- 用户人口统计特征
- 城市地理信息
- 时间约束
输出:
- 回转半径
- 每日位置数量
- 意图序列
- 意图比例
评估流程
数据准备阶段
从数据集加载北京用户的真实移动行为数据
配置智能体参数和环境设置
为每个用户生成相应的移动行为任务
行为生成阶段
智能体分析用户人口统计特征
理解城市地理布局和交通网络
生成符合用户特征的日常移动模式
评估阶段
比较生成数据分布与真实数据分布
计算Jensen-Shannon散度评估分布相似性
结合各种指标获得最终分数
评估指标
针对LLM智能体在大规模城市环境下需复现用户出行模式分布与个体差异的挑战,DailyMobility以四类关键时空特征(回转半径、日访问量、意图序列及意图比例)的Jensen–Shannon散度为基础,通过均值化处理并映射至0–100刻度的Final Score来统一衡量模型在宏观统计分布与微观行为多样性两方面的拟合度,确保每一维度的偏差都能被细粒度发现与综合比较。
Jensen-Shannon散度 (JSD)
用于衡量生成数据分布与真实数据分布的相似性,JSD值越低表示分布越相似
JSD(P||Q) = 0.5 × KL(P||M) + 0.5 × KL(Q||M)
其中:P为真实数据分布,Q为生成数据分布,M = (P + Q) / 2
具体评估指标
回转半径JSD权重: 25%
每日位置数量JSD权重: 25%
意图序列JSD权重: 25%
意图比例JSD权重: 25%
最终分数
最终分数 = ((1 - JSD_回转半径 + 1 - JSD_位置数量 + 1 - JSD_序列 + 1 - JSD_比例) / 4) × 100
分数范围0-100
评估标准分数越高质量越好
数据集信息
数据集仓库tsinghua-fib-lab/daily-mobility-generation-benchmark
支持模式inference (测试模式不支持)
数据特征北京用户的日常移动行为数据