挑战姜萍数学竞赛原题!AI小白与ChatGPT4o的绝望之旅,最后双双崩溃

月灵星 2024-06-22 20:27:31

最近,17岁的姜萍因为进入2024阿里巴巴全球数学竞赛决赛而引起了广泛关注。她是该竞赛史上第一个进入决赛的中专生。

阿里巴巴全球数学竞赛由马云于201

最近,17岁的姜萍因为进入2024阿里巴巴全球数学竞赛决赛而引起了广泛关注。她是该竞赛史上第一个进入决赛的中专生。

阿里巴巴全球数学竞赛由马云于2018年发起,现已成为全球规模最大的在线数学竞赛。今年竞赛创新地允许AI队伍参赛,但没有一支AI队伍进入决赛。最高分仅34分,而人类第一名得分为113分,姜萍得分为93分。

被这些超高难度的题目所吸引,我决定用34分AI队伍的“复杂问题解决的自迭代代理系统”挑战这些难题,并将它们输入ChatGPT。结果,连ChatGPT 4o也无法正确解答这些高难度的数学题,最终与我一起双双崩溃!

这次挑战不仅让我见识到了姜萍的天才,也揭示了当前AI技术在面对真正复杂问题时的局限性。即使有了如此强大的工具,依然无法替代人类智慧的深度和灵活性。

我使用的大神提供的系统,该系统包含两组模型:主模型/学生模型和评价模型/教师模型。整个过程大致如下:

1

第一题:正确答案为C

2

我:A、运用主模型根据详细说明逐步回答上述数学问题:1、列出相关知识点2、写下最初的思考过程 3、扩展具体的计算过程(不跳过步骤)4、给出最终结果。

B、将主模型的答案提交评价模型审核。评估模型也逐步进行:1、概述,以检查明显的漏洞并提供初步反馈。2、仔细检查计算过程以发现可能的错误。3、评估推理逻辑是否严谨。4、汇总所有反馈。

ChatGPT 4o:经过反复验证,答案为B。

3

好,老师说第一题不会,就看后面的题,总有自己会的。

第二题:有两小题,正确答案分别为B和A。

4

我:按照主模型得到答案:B和B;将主模型的答案提交评价模型审核。在将以上评价模型的反馈给主模型,请在次提供参考修改答案得到的是C和C。并且循环三次都是C。下面只放第一次生成的结果。

ChatGPT 4o:按照主模型得到答案都是B。

5

好,就假装第二题也顺顺利利的,继续进军第三题。

第三题:论证题

6

ChatGPT 4o:

7

一顿操作猛如虎,仔细一看二百五。以下是正确答案,虽然我作为数学老白,看不懂,但知道这符号不一样啊。

8

带着深深的无力感,我来到第四题。

9

ChatGPT 4o:

10

此处省略N字,直接上答案:

11

我直奔第七题,因为我看到音乐盒了,终于看到了认识的事物,心里甚感安慰。结果题目就占了将近两页。

12

ChatGPT 4o:

13

我:你解答的题不对,请问你你有何感想,你的心理历程是什么?

ChatGPT 4o:虽然我可能答的不对,但每道题都给的有思路和解题步骤,自我感觉棒棒哒~

14

15

这次数学竞赛不仅仅是对入围者个人能力的肯定,也在一定程度上反映了AI技术的发展现状。虽然AI在许多领域已经展示了其强大的计算和处理能力,但在面对复杂的数学问题时,依然存在显著的局限性。入围者的成功不仅仅是个人的胜利,也是人类智慧在面对挑战时灵活应变和深入思考的体现。

在AI技术不断发展的今天,我们看到它在各个领域的广泛应用,包括医疗、金融、教育等。然而,这次竞赛结果显示,AI在处理高难度数学问题时,仍需依赖人类的直觉和创造力。AI可以辅助我们解决许多问题,但它还不能完全取代人类的智慧。

姜萍的成功也引发了关于她背景的争议。作为一个中专生,她打破了学术界对人才培养的传统看法,这也提醒我们,在教育领域,需要更多关注和支持那些可能被忽视的天才。

总的来说,这次竞赛不仅展示了个人的卓越能力,也揭示了AI技术的局限性和人类智慧的不可替代性。未来,我们应当继续探索人类智慧和AI技术的协同发展,让它们在各自擅长的领域共同发挥作用,推动社会的进步和发展。

1 阅读:11

月灵星

简介:有玛丽苏病的小姐姐,永远18岁。