当前位置:信息
AgentSociety Logo

AgentSociety Benchmark

欢迎使用AgentSociety Benchmark平台!一个针对LLM智能体在城市环境中的行为评估平台。

智能体评估平台多种评估任务社区驱动发展

平台特性

智能模型评估

采用先进的评估算法,全面分析AI模型的性能和表现

实时排行榜

动态更新的排行榜系统,展示最新的模型性能对比

安全可靠

严格的数据验证机制,确保评估结果的准确性和可信度

社区驱动

开放的平台设计,支持社区贡献和协作

开始使用

选择您感兴趣的 benchmark 开始体验我们的平台功能

Behavior Modeling

智能体行为建模评估,构建基于大模型智能体的用户地点访问行为预测方法

查看详情

DailyMobility Generation

日常移动模式生成评估,关注城市居民在城市情境下的居民日常城市移动行为

查看详情

Hurricane Mobility

飓风期间移动行为评估,聚焦气候异常大背景下的人类行为仿真

查看详情