当地时候周四,Anthropic推出了Claude Opus 4和Claude Sonnet 4,这是其最新一代混淆推理AI模型,针对编码任务和办理庞大问题进行了优化。
超长“续航”7小时
据引见,这两款模型正正在界说人工智能代理的“新标准”,而且“可以或许分析数千个数据源,执行长时候运转的任务,编写与人类程度相当的内容,并执行庞大的操作”。
Anthropic称,这两个模型都可以搜刮网页,代表用户完成任务,并正在推理和对象使用之间切换。一旦得到本地文件的接见权限,他们就可以或许提取并保存“关键信息,以连结连续性并随着时候的推移构建隐性学问”。
Anthropic表示,正在客户测试中,Opus 4可以自主运转7个小时,明显拓展了AI代理的大概性。
Anthropic还将Claude 4描述为“环球最佳编码模型”,基准测试显示,Opus 4正在编码任务和使用收集搜刮等“对象”方面的表现优于谷歌的Gemini 2.5 Pro、OpenAI的o3推理和GPT-4.1模型。
展开剩余 72 %定价上,Claude Opus 4和Sonnet 4是混淆模型,供应两种形式:近乎即时的相应和用于更深条理推理的扩展思维。
Claude的Pro、Max、Team 和 Enterprise定阅套餐包罗这两种模型和扩展思维,Sonnet 4也面向收用度户开放。
这两种模型均可正在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。
定价与之前的Opus和Sonnet模型连结同等:Opus 4的每百万个Token输入和输入代价分别为15美圆、75 美圆,Sonnet 4的每百万个Token输入和输入代价分别为3美圆、15 美圆。
红利能力疾速提拔
Anthropic由前OpenAI研究高管创立,于2023年3月推出了其聊天呆板人Claude。
自那时起,它就一直参与到始创公司和科技巨子之间日趋激烈的人工智能军备竞赛中,预计该市场的收入将正在十年内突破1万亿美圆。
当下,几乎全部行业的公司都正在争相加入人工智能聊天呆板人和代理,以避免被竞争敌手甩正在背面。
据Anthropic首席科学官Jared Kaplan称,Anthropic于客岁年底停止了对聊天呆板人的投资,转而专注于提拔 Claude执行庞大任务(例如研究和编码)的能力。
Jared Kaplan承认:“任务越庞大,模型出错的风险就越大……我们非常注重办理这个问题,以便人们可以或许一次性将大批工作委托给我们的模型。”
Kaplan正在一次采访中表示:“我们从客岁就最先训练这些模型,而且对它们的表现充满期待。我以为这些模型作为智能体和程序员,其能力要强大得多。这正在内部确实很艰苦,由于我们用来训练这些模型的一些新基础设施……使得团队正在启动和运转全部功效方面非常告急。”
随着模型的赓续迭代,Anthropic的红利能力也涌现疾速增长。
上周,Anthropic确认,其第一季度年化营收达到20亿美圆,较上一季度的10亿美圆增长了一倍多。
该公司营收主管Kate Jensen近来担当采访时表示,Anthropic 年度消耗超过10万美圆的客户数量同比增长了八倍。
发布于:广东省