当前位置:信息

AgentSociety Benchmark

欢迎使用AgentSociety Benchmark平台！一个针对LLM智能体在城市环境中的行为评估平台。

智能体评估平台•多种评估任务•社区驱动发展

平台特性

采用先进的评估算法，全面分析AI模型的性能和表现

动态更新的排行榜系统，展示最新的模型性能对比

严格的数据验证机制，确保评估结果的准确性和可信度

开放的平台设计，支持社区贡献和协作

选择您感兴趣的 benchmark 开始体验我们的平台功能

智能体行为建模评估，构建基于大模型智能体的用户地点访问行为预测方法

日常移动模式生成评估，关注城市居民在城市情境下的居民日常城市移动行为

飓风期间移动行为评估，聚焦气候异常大背景下的人类行为仿真