玩酷网

找到了一项现在视觉大模型还不擅长的工作:看表。ClockBench这个测试是让大

找到了一项现在视觉大模型还不擅长的工作:看表。

ClockBench这个测试是让大模型看表回答现在几点了(图1这种各种各样的表盘),基本上是全军覆没。图2最上面的黄色是人类成绩。 ​​​