玩酷网

挑战姜萍数学竞赛原题！AI小白与ChatGPT4o的绝望之旅，最后双双崩溃

月灵星 2024-06-22 20:27:31

最近，17岁的姜萍因为进入2024阿里巴巴全球数学竞赛决赛而引起了广泛关注。她是该竞赛史上第一个进入决赛的中专生。

阿里巴巴全球数学竞赛由马云于201

最近，17岁的姜萍因为进入2024阿里巴巴全球数学竞赛决赛而引起了广泛关注。她是该竞赛史上第一个进入决赛的中专生。

阿里巴巴全球数学竞赛由马云于2018年发起，现已成为全球规模最大的在线数学竞赛。今年竞赛创新地允许AI队伍参赛，但没有一支AI队伍进入决赛。最高分仅34分，而人类第一名得分为113分，姜萍得分为93分。

被这些超高难度的题目所吸引，我决定用34分AI队伍的“复杂问题解决的自迭代代理系统”挑战这些难题，并将它们输入ChatGPT。结果，连ChatGPT 4o也无法正确解答这些高难度的数学题，最终与我一起双双崩溃！

这次挑战不仅让我见识到了姜萍的天才，也揭示了当前AI技术在面对真正复杂问题时的局限性。即使有了如此强大的工具，依然无法替代人类智慧的深度和灵活性。

我使用的大神提供的系统，该系统包含两组模型：主模型/学生模型和评价模型/教师模型。整个过程大致如下：

1

第一题：正确答案为C

2

我：A、运用主模型根据详细说明逐步回答上述数学问题：1、列出相关知识点2、写下最初的思考过程 3、扩展具体的计算过程（不跳过步骤）4、给出最终结果。

B、将主模型的答案提交评价模型审核。评估模型也逐步进行：1、概述，以检查明显的漏洞并提供初步反馈。2、仔细检查计算过程以发现可能的错误。3、评估推理逻辑是否严谨。4、汇总所有反馈。

ChatGPT 4o：经过反复验证，答案为B。

3

好，老师说第一题不会，就看后面的题，总有自己会的。

第二题：有两小题，正确答案分别为B和A。

4

我：按照主模型得到答案：B和B；将主模型的答案提交评价模型审核。在将以上评价模型的反馈给主模型，请在次提供参考修改答案得到的是C和C。并且循环三次都是C。下面只放第一次生成的结果。

ChatGPT 4o：按照主模型得到答案都是B。

5

好，就假装第二题也顺顺利利的，继续进军第三题。

第三题：论证题

6

ChatGPT 4o：

7

一顿操作猛如虎，仔细一看二百五。以下是正确答案，虽然我作为数学老白，看不懂，但知道这符号不一样啊。

8

带着深深的无力感，我来到第四题。

9

ChatGPT 4o：

10

此处省略N字，直接上答案：

11

我直奔第七题，因为我看到音乐盒了，终于看到了认识的事物，心里甚感安慰。结果题目就占了将近两页。

12

ChatGPT 4o：

13

我：你解答的题不对，请问你你有何感想，你的心理历程是什么？

ChatGPT 4o：虽然我可能答的不对，但每道题都给的有思路和解题步骤，自我感觉棒棒哒~

14

15

这次数学竞赛不仅仅是对入围者个人能力的肯定，也在一定程度上反映了AI技术的发展现状。虽然AI在许多领域已经展示了其强大的计算和处理能力，但在面对复杂的数学问题时，依然存在显著的局限性。入围者的成功不仅仅是个人的胜利，也是人类智慧在面对挑战时灵活应变和深入思考的体现。

在AI技术不断发展的今天，我们看到它在各个领域的广泛应用，包括医疗、金融、教育等。然而，这次竞赛结果显示，AI在处理高难度数学问题时，仍需依赖人类的直觉和创造力。AI可以辅助我们解决许多问题，但它还不能完全取代人类的智慧。

姜萍的成功也引发了关于她背景的争议。作为一个中专生，她打破了学术界对人才培养的传统看法，这也提醒我们，在教育领域，需要更多关注和支持那些可能被忽视的天才。

总的来说，这次竞赛不仅展示了个人的卓越能力，也揭示了AI技术的局限性和人类智慧的不可替代性。未来，我们应当继续探索人类智慧和AI技术的协同发展，让它们在各自擅长的领域共同发挥作用，推动社会的进步和发展。

1 阅读：11

月灵星

简介：有玛丽苏病的小姐姐，永远18岁。

作者最新文章

情感TOP

情感最新文章