互联网资讯 / 人工智能 · 2026年4月20日 0

Claude Opus 4.7 发布:使用成本上升,用户反馈分化

【TechWeb】4月17日,Anthropic发布了最新模型Claude Opus 4.7。相比于Claude Opus 4.6,新模型在高级软件工程领域实现了显著进步,在多模态能力和视觉能力上也有了大幅增强,能够生成更高质量的界面、幻灯片等。

Claude Opus 4.7 发布:使用成本上升,用户反馈分化

Claude Opus 4.7 的定价与Claude Opus 4.6相同,每百万输入Token 5美元,每百万输出Token 2.5美元。

Anthropic在公告中明确表示,新分词器会导致相同内容的Token数变为原来的1.0到1.35倍。而API单价没有变化,实际成本上涨了10%-35%。

目前,已经有不少用户连夜试用了新的Claude Opus 4.7,从社交平台的信息来看,用户对Claude Opus 4.7的评价较为两极。

部分用户认可Claude Opus 4.7在编程能力的提升,但在文案撰写、对话沟通等方面指出了较多槽点。

Claude Opus 4.7主要能力提升

Claude Opus 4.7 发布:使用成本上升,用户反馈分化

根据Anthropic发布的数据,Claude Opus 4.7在处理复杂、长时间运行的任务时更加严谨和一致,能够自行验证输出结果。用户反馈称,原本需要密切监督的复杂编码工作,现在可以放心交给Claude Opus 4.7。

该模型能够准确遵循指令,并在汇报前主动验证自身输出。

Claude Opus 4.7支持更高分辨率的图像输入,长边最大可达2,576像素,是前代Claude模型的3倍。这使得模型可以处理依赖精细视觉细节的多模态任务,如读取密集截图、从复杂表中提取数据等。

Claude Opus 4.7严格按字面意思理解并执行指令。这意味着为旧模型编写的提示词可能会产生意外结果,用户需要据此调整提示词和工具链。

内部测试显示,Claude Opus 4.7是更高效的金融分析师,能生成严谨的分析模型、更专业的演示文稿,并实现更紧密的任务整合。此外,在第三方评估GDPval-AA中,Claude Opus 4.7也达到了最先进水平。

Claude Opus 4.7更擅长使用基于文件系统的记忆,能够在多轮工作中记住重要信息,并在新任务中直接利用这些记忆,减少前期的上下文输入。

Claude Opus 4.7 发布:使用成本上升,用户反馈分化

在安全性方面,Claude Opus 4.7配备了自动检测和拦截功能,阻止涉及禁止或高风险网络安全用途的请求。Anthropic表示,安全专业人士如需将Claude Opus 4.7用于合法网络安全目的可申请加入新推出的“网络验证计划”。

总体而言,Claude Opus 4.7的安全性与Claude Opus 4.6相似,在欺骗、谄媚、协助滥用等行为上发生成率较低。在诚实性和抵御恶意注入攻击方面,Claude Opus 4.7优于Claude Opus 4.6,但在某些方面则略有不足。

新功能介绍

Anthropic发布的blog显示,Claude Opus 4.7还新增了不少功能,包括在高和Max之间新增了高水平,让用户在困难问题上更精细地权衡推理质量和延迟。

Claude Opus 4.7 发布:使用成本上升,用户反馈分化

除了支持更高分辨率图像外,还测试了“任务预算”,让开发者可以引导Claude的Token开销,使其在较长运行中合理分配工作。

Claude的新命令/ultraReview会启动专门的审查会话,通读代码变更并标记出细心审查者才能发现的bug和设计问题。用户可免费试用3次。

此外,auto Mode(自动模式)已向Max用户开放,Claude可代为做出权限决定,从而以更少的中断运行更长的任务,同时降低风险。

Claude Opus 4.7是Claude Opus 4.6的直接升级版,但有些变化会影响Token使用量,需要提前规划:

一是,新分词器改进了文本处理方式,但同样的输入可能会映射为更多的Token,具体比例约为1.0到1.35倍。这取决于内容类型。

二是,更高努力级别下的思考量增加,尤其是在智能体场景的后续轮次中,Claude Opus 4.7会产生更多输出Token。

用户可以通过调整努力参数、设置任务预算或提示模型更简洁来控制Token使用量。

Anthropic的内部测试显示,在内部编码评估中,所有努力级别的Token效率均有提升。

用户评价两极

对Claude Opus 4.7的编程能力,不少用户在实际体验后均给出了肯定的评价,能力确实更强大了。

让不少用户感到不满的是Token消耗。用户表示,官方通篇强调视觉提升,却未提及Token消耗增加的问题。使用同一张设计稿测试后,Claude Opus 4.7的输入Token直接飙升至Claude Opus 4.6的3倍多。

另外,Claude Opus 4.7在某些能力上未见提升。

在长上下文检索中,Claude Opus 4.6评分能到78.3%,而Claude Opus 4.7直接掉到32.2%。Anthropic解释称新模型遇到缺失信息会直接报错,不再像以前那样随意编造。用户实际测试发现,即使信息在上下文中,它也可能会遗漏。对于法律、金融等依赖长文档的场景,使用时需谨慎。

Claude Opus 4.7的联网搜索和Agent能力也略有下降,Agentic Search评测评分从Claude Opus 4.6的83.7%降至Claude Opus 4.7的79.3%,甚至被GPT-5.4甩开一截。

用户反映Claude Opus 4.7的文笔发生了很大变化。

许多写作者表示,Claude Opus 4.7使用了较多晦涩的企业术语,续写内容显得生硬,用户吐槽:“以前用它改文案,现在改它的文案花了两倍的时间”。

最后,思考过程还被隐藏。Claude Opus 4.7默认不输出推理摘要,想查看逻辑需要手动添加命令。复杂任务出错时,用户根本不知道它哪里理解出错,排查成本增加。有人认为官方可能担心被蒸馏,但开发者体验确实受到影响。

总之,Claude Opus 4.7并非无痛升级。如果不涉及硬核编码场景,建议先观望。