AgentOccam/evaluation_harness
yuyr bb7393bcb3 增加环境变量指向g14部署webarena环境;
map网站使用socks5连接到官网openstreetmap;
模型改成gpt-4o; llm fuzzy math也使用4o;
增加generate_test_data.py脚本
2025-04-15 18:16:52 +08:00
..
__init__.py init 2025-01-22 11:32:35 -08:00
evaluators.py 增加环境变量指向g14部署webarena环境; 2025-04-15 18:16:52 +08:00
helper_functions.py 增加环境变量指向g14部署webarena环境; 2025-04-15 18:16:52 +08:00