GPT-4时代终结，亦恺×AWS揭秘新王Claude 3_

未来的数字时代已经来临，随着2024年的到来，人工智能正式迈入数据元年。最近三个月发生了几件大事，除了首个文生视频模型Sora发布、英伟达最强芯片Blackwell GPU发行外，最惹人注目的就是Claude 3大模型的横空出世，全面碾压GPT-4。

今天是亦恺的AIGC创新日，亦恺联合亚马逊云科技将共同探讨Claude 3产品的应用及趋势。亚马逊云科技的Amazon Bedrock目前是唯一一个提供Claude 3 Sonnet 的托管服务，所以亚马逊云科技对Claude 3 模型的各项优势更为了解，而亦恺作为领先的数据智能服务商，也一直致力于AIGC的技术革命，目前正在积极推进基于序列理解和大语言模型的相关研究。

Claude3是什么Anthropic目前的评估表明，Claude3模型系列在数学应用题解决（MATH）和多语言数学（MGSM）基准（目前用于大语言模型的关键基准）方面优于同类模型。它主要包含三个模型，Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opus。

Haiku 是市场上最快且最具成本效益的模型。它是一种快速紧凑的模型，具有近乎即时的响应能力。对于绝大多数工作负载，Sonnet的速度比 Claude 2 和 Claude 2.1 快 2 倍，且智能水平更高。它擅长执行需要快速响应的智能任务，例如知识检索或销售自动化。它在智能和速度之间实现了理想的平衡——对于企业用例是尤其重要的品质。Opus 是最先进、最强大的基础模型，具有深度推理、高级数学和编码能力，在高度复杂的任务上具有顶级性能。它可以非常流畅地导航开放式提示和新颖场景，包括任务自动化、假设生成以及图表、图形和预测的分析。Claude3优势

近乎实时响应

Claude 3 具有与其他头部模型相当的复杂视觉功能。它们可以处理各种视觉格式数据，包括照片、图表、图形和技术图表。Anthropic 表示，它们的一些客户 50% 以上的知识库以各种数据格式进行编程，例如 PDF、流程图或演示幻灯片。因此，新模型强大的视觉能力非常有帮助。

更少拒绝回复

以前的 Claude 模型经常做出不必要的拒绝，这表明模型缺乏语境理解。Anthropic 在这一领域取得了有意义的进展：与前几代模型相比，即使用户 prompt 接近系统底线，Opus、Sonnet 和 Haiku 拒绝回答的可能性明显降低。如下所示，Claude 3 模型对请求表现出更细致的理解，能够识别真正的有害 prompt，并且拒绝回答无害 prompt 的频率要少得多。