玩酷网

程序员发布AI评分工具，量化评估ChatGPT等模型愚蠢程度

2025-09-18 12:48:07 新浪财经科技

[程序员自制开源AI评分工具，衡量大模型“愚蠢程度”]程序员ionutvi发布开源工具AIBenchmarkTool，可量化评估ChatGPT、Grok等AI模型的“愚蠢程度”，通过140项任务测试准确性、稳定性等指标，并综合价格给出性价比排名。#AI工具##开源项目#

阅读：0 点赞：0

2025-09-12 互联黑板报

标签： ai 百度人工智能

2025-09-17 广东深圳股侠

标签：算力 ai 华为华为麒麟芯片

2025-09-17 活泼小狗

标签：英伟达路透社芯片 ai it芯片

2025-09-10 互联网嘴哥

标签：脉冲大地震