[程序员自制开源AI评分工具,衡量大模型“愚蠢程度”]程序员ionutvi发布开源工具AIBenchmarkTool,可量化评估ChatGPT、Grok等AI模型的“愚蠢程度”,通过140项任务测试准确性、稳定性等指标,并综合价格给出性价比排名。#AI工具##开源项目#
[程序员自制开源AI评分工具,衡量大模型“愚蠢程度”]程序员ionutvi发布开源工具AIBenchmarkTool,可量化评估ChatGPT、Grok等AI模型的“愚蠢程度”,通过140项任务测试准确性、稳定性等指标,并综合价格给出性价比排名。#AI工具##开源项目#