学术资讯 » 学界研圈

  • 首 页
  • 期刊选题
  • 期刊点评
  • 期刊大全
  • 学人博客
  • 编辑征稿
  • 投稿选刊
  • 投稿群聊
  • 学术会议
  • 万维读书
  • SCI/E期刊
  • SSCI期刊
  • AHCI期刊
  • 人工智能 · GPT-4 可能在变“笨”:解数学题准确率从 97.6% 降至 2.4%

    阅读: 2023/7/28 10:09:32

    近日,美国斯坦福大学和加利福尼亚大学伯克利分校的研究人员在 arXiv 上发布了一篇未经同行评审的预印本论文,对两种最广泛使用的大型语言模型(LLM)服务——GPT-3.5 和 GPT-4 ——在 2023 年 3 月和 6 月的两个版本进行了评估,发现它们在不同任务上的表现和行为都有很大的变化。

    据介绍,该研究中涉及的任务包括解决数学问题、回答敏感/危险问题、生成代码和视觉推理。研究人员发现,与 3 月版本相比,6 月版本的 GPT-4 在解决数学问题和回答敏感问题方面表现得更差,例如识别素数的准确率从 97.6% 下降至 2.4%,但在视觉推理方面有所改进;GPT-3.5 则在解决数学问题和回答敏感问题方面表现得更好,但二者都在生成代码方面出现了更多错误。这些发现表明,同一种 LLM 服务在短时间内的行为可能发生显著变化,因此需要持续监测 LLM 的质量。研究人员已经将他们的评估数据和 ChatGPT 响应发布在 GitHub 上,以鼓励进一步的研究。(arXiv)

    转自:“科研圈”微信公众号

    如有侵权,请联系本站删除!


    浏览(226)
    点赞(0)
    收藏(0)
  • 上一篇:可持续发展 · 撒哈拉沙漠的尘埃可以加强甲烷的去除

    下一篇:推荐阅读丨郑勇:地方高校法学本科教育质量评价体系建构与实践研究——以广西师范大学为例

  • 首页

  • 文章

  • 期刊

  • 帮助

  • 我的

版权所有 Copyright@2023    备案号:豫ICP备2021036211号