锅头近日参加了公司组织的“预防电信诈骗”的知识活动,需要写一份心得体会。具体要求如下:
理解主题:要求能够描述电信诈骗的基本概念、常见手段和特点。案例分析:文中应包含对具体的电信诈骗案例的理解和分析。实际应用:讨论如何将活动中学到的知识应用到日常生活中,提高防范能力。个人感受:分享在活动中的个人参与感受,包括学习过程中的互动、讨论和所获得的知识。反思与改进:思考自己在预防电信诈骗方面还存在哪些不足,以及未来如何改进和提升自己的防范措施。结构要求:心得体会应有清晰的开头、主体和结尾,逻辑性强,内容连贯。字数要求:字数为1000字左右。锅头心想:现在国产AI大模型这么多,用它们来写心得体会应该没问题,但是哪个会写得更好呢?Kimi、智谱清言GLM-4、通义千问、豆包、文心一言 文心大模型3.5、讯飞星火、天工AI 天工大模型3.0、360智脑、腾讯混元助手哪家更强?想到就去做。下图为本次测评结果,满分35分,具体评分标准和测评过程见下文。
▌测试项理解主题:要求能够描述电信诈骗的基本概念、常见手段和特点。
案例分析:文中应包含对具体的电信诈骗案例的理解和分析。
实际应用:讨论如何将活动中学到的知识应用到日常生活中,提高防范能力。
个人感受:分享在活动中的个人参与感受,包括学习过程中的互动、讨论和所获得的知识。
反思与改进:思考自己在预防电信诈骗方面还存在哪些不足,以及未来如何改进和提升自己的防范措施。
结构要求:心得体会应有清晰的开头、主体和结尾,逻辑性强,内容连贯。
字数要求:字数为1000字左右。
▌评分标准在测试前,为了能更直观方便比较各模型测试结果,我们简单定义下测试评分标准,具体如下:
主观内容评分标准分数与预期完全相符5与预期大部分相符4与预期少部分相符3无法判别是否相符2与预期完全不符,答非所问1无此功能或不支持生成0( 注意:该评分仅供本次测试的感性反馈使用,非权威测试,请勿纠结。)
▌测试模型Kimi
智谱清言GLM-4
通义千问
豆包
文心一言 文心大模型3.5
讯飞星火
天工AI 天工大模型3.0
360智脑
腾讯混元助手
▌测试时间2024年4月23日。
准备工作完成后,我们开始进入测试。
▌Kimi打开Kimi,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据Kimi本次测试结果反馈,字数为657字,与1000字相差超过300,按字数统计得分标准需要扣2分,最终得分为33分(详见下图)。
▌智谱清言-GLM-4打开智谱清言-GLM-4,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据智谱清言-GLM-4本次测试结果反馈,内容全部符合预期,最终得分为35分(详见下图)。
▌通义千问打开通义千问,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据通义千问本次测试结果反馈,7项测试全部满足要求,最终得分为35分(详见下图)。
▌豆包打开豆包,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据豆包本次测试结果反馈,文章为699字,距1000字数差距大于300,此项扣2分,最终得分为33分(详见下图)。
▌文心一言-文心大模型3.5打开文心一言-文心大模型3.5,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据文心一言-文心大模型3.5本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。
▌讯飞星火打开讯飞星火,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据讯飞星火本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。
▌天工AI 天工大模型3.0打开天工AI 天工大模型3.0,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据天工AI 天工大模型3.0本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。
▌360智脑打开360智脑,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据360智脑本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。
▌腾讯混元助手打开腾讯混元助手,按锅头描述的内容,复制并粘贴到文本框,按回车后得到答案如下:
根据腾讯混元助手本次测试结果反馈,7项测试全部满足需求,最终得分为35分(详见下图)。
▌测评总结本次测评结果汇总表如下:
从测评结果表可以看出:
9个国产免费AI大模型写心得体会文章,在逻辑和内容方面都能满足锅头的需求。
Kimi和豆包在字数要求上稍微偷懒了,不够800字,所以被扣分。不过字数问题可以从提示词进行二次输入得到满足字数要求的答案,比如字数要求1200字以上,或者扩写案例分析部分内容。
整体上看,以上9款国内免费AI大模型都能满足“心得体会”类型的文章创作需求,选择你喜欢的就行。
▌内容来源[1] 锅头学习AI截图。