【AI测评】9个国内免费AI大模型同时写“心得体会”文章,哪家更强?(附测评结果)

跟锅头一起学AI 2024-04-23 21:31:36

▌锅头导读

锅头近日参加了公司组织的“预防电信诈骗”的知识活动,需要写一份心得体会。具体要求如下:

理解主题:要求能够描述电信诈骗的基本概念、常见手段和特点。案例分析:文中应包含对具体的电信诈骗案例的理解和分析。实际应用:讨论如何将活动中学到的知识应用到日常生活中,提高防范能力。个人感受:分享在活动中的个人参与感受,包括学习过程中的互动、讨论和所获得的知识。反思与改进:思考自己在预防电信诈骗方面还存在哪些不足,以及未来如何改进和提升自己的防范措施。结构要求:心得体会应有清晰的开头、主体和结尾,逻辑性强,内容连贯。字数要求:字数为1000字左右。

锅头心想:现在国产AI大模型这么多,用它们来写心得体会应该没问题,但是哪个会写得更好呢?Kimi、智谱清言GLM-4、通义千问、豆包、文心一言 文心大模型3.5、讯飞星火、天工AI 天工大模型3.0、360智脑、腾讯混元助手哪家更强?想到就去做。下图为本次测评结果,满分35分,具体评分标准和测评过程见下文。

▌测试项

理解主题:要求能够描述电信诈骗的基本概念、常见手段和特点。

案例分析:文中应包含对具体的电信诈骗案例的理解和分析。

实际应用:讨论如何将活动中学到的知识应用到日常生活中,提高防范能力。

个人感受:分享在活动中的个人参与感受,包括学习过程中的互动、讨论和所获得的知识。

反思与改进:思考自己在预防电信诈骗方面还存在哪些不足,以及未来如何改进和提升自己的防范措施。

结构要求:心得体会应有清晰的开头、主体和结尾,逻辑性强,内容连贯。

字数要求:字数为1000字左右。

▌评分标准

在测试前,为了能更直观方便比较各模型测试结果,我们简单定义下测试评分标准,具体如下:

主观内容评分标准分数与预期完全相符5与预期大部分相符4与预期少部分相符3无法判别是否相符2与预期完全不符,答非所问1无此功能或不支持生成0

( 注意:该评分仅供本次测试的感性反馈使用,非权威测试,请勿纠结。)

▌测试模型

Kimi

智谱清言GLM-4

通义千问

豆包

文心一言 文心大模型3.5

讯飞星火

天工AI 天工大模型3.0

360智脑

腾讯混元助手

▌测试时间

2024年4月23日。

准备工作完成后,我们开始进入测试。

▌Kimi

打开Kimi,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据Kimi本次测试结果反馈,字数为657字,与1000字相差超过300,按字数统计得分标准需要扣2分,最终得分为33分(详见下图)。

▌智谱清言-GLM-4

打开智谱清言-GLM-4,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据智谱清言-GLM-4本次测试结果反馈,内容全部符合预期,最终得分为35分(详见下图)。

▌通义千问

打开通义千问,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据通义千问本次测试结果反馈,7项测试全部满足要求,最终得分为35分(详见下图)。

▌豆包

打开豆包,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据豆包本次测试结果反馈,文章为699字,距1000字数差距大于300,此项扣2分,最终得分为33分(详见下图)。

▌文心一言-文心大模型3.5

打开文心一言-文心大模型3.5,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据文心一言-文心大模型3.5本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。

▌讯飞星火

打开讯飞星火,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据讯飞星火本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。

▌天工AI 天工大模型3.0

打开天工AI 天工大模型3.0,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据天工AI 天工大模型3.0本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。

▌360智脑

打开360智脑,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据360智脑本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。

▌腾讯混元助手

打开腾讯混元助手,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:

根据腾讯混元助手本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。

▌测评总结

本次测评结果汇总表如下:

从测评结果表可以看出:

9个国产免费AI大模型写心得体会文章,在逻辑和内容方面都能满足锅头的需求。

Kimi和豆包在字数要求上稍微偷懒了,不够800字,所以被扣分。不过字数问题可以从提示词进行二次输入得到满足字数要求的答案,比如字数要求1200字以上,或者扩写案例分析部分内容。

整体上看,以上9款国内免费AI大模型都能满足“心得体会”类型的文章创作需求,选择你喜欢的就行。

▌内容来源

[1] 锅头学习AI截图。

0 阅读:0

跟锅头一起学AI

简介:持续学习AI知识和使用技巧,思考如何用AI高效学习办公