
总冠军
Sora-2-Pro 总分领先:74.63% 对 73.20% (+1.43pp)。.
最适合控制、创意和多视图
Kling-v2-5-Turbo 在可控性和创意方向方面表现更佳,在多视图稳定性方面也更胜一筹:可控性 +7.30pp,创意 +6.66pp,多视图一致性 +36.43pp。.
最适合展现人类真实感和身份一致性
Sora-2-Pro 在逼真的人物建模和保持同一角色在不同镜头中的一致性方面表现更佳:人物保真度 +16.30pp,人物身份 +33.91pp,人体解剖结构 +14.97pp。.
根据最新的 VBench-IBench 测试结果,按总分和核心维度进行总结。.
| 公制 | Sora-2-Pro | Kling-v2-5-Turbo | 优胜者 |
|---|---|---|---|
| 总分 | 74.63% | 73.20% | Sora(+1.43pp) |
| 创造力 | 77.41% | 84.07% | 克林(+6.66pp) |
| 常识 | 88.89% | 83.33% | Sora(+5.56pp) |
| 可控性 | 58.41% | 65.71% | 克林(+7.30pp) |
| 人类忠诚 | 87.87% | 71.57% | Sora(+16.30pp) |
| 物理 | 60.56% | 61.33% | 克林(+0.77pp) |
最大的分数差距,按精细指标细分——这样你就能看到差异来自哪里。.
| 精细度量 | Sora-2-Pro | Kling-v2-5-Turbo | Δ(pp) | 它的含义 |
|---|---|---|---|---|
| 多视图一致性 | 20.00% | 56.43% | +36.43 | 跨多个角度/摄像机视图的一致性 |
| 人类身份 | 74.51% | 40.60% | +33.91(Sora) | 同一个人看起来是否始终如一 |
| 材料 | 77.78% | 44.44% | +33.34 (Sora) | 材质(织物/金属/玻璃)的真实感 |
| 动态属性 | 55.56% | 88.89% | +33.33 | 运动属性(姿势/表情)的变化 |
| 复杂情节 | 68.89% | 37.78% | +31.11 (Sora) | 复杂场景中的叙事连贯性 |
| 动议指令理解 | 77.78% | 100.00% | +22.22 | 按照逐步动作顺序 |
* Δ(pp) 表示百分点差异。标签 (Sora/Kling) 表示领先模型。.
对基准的简要解读——每种模型在实际项目中更适合做什么。.
选择您的目标——我们会根据基准优势推荐最佳模型。.
增强了人体真实感、身份一致性和解剖结构稳定性——非常适合特写镜头和重复出现的角色。.
创意得分更高,更适合大胆的艺术指导和风格化、引人注目的镜头。.
更好的控制性和更强的行动指令理解能力——当您需要精确地遵循指令时,这将非常有用。.
更强的常识性和更复杂的剧情处理——更有利于跨多个镜头的连贯叙事。.
多视角一致性方面领先一大截——最适合在保持拍摄对象不变的情况下切换拍摄角度。.
更高的运动理性——更稳定的身体行为,更少的非自然现象。.
快速解答有关此对比和基准测试设置的最常见问题。.
本页总结了模型的优势,使用 VBench 基准测试框架及其公开排行榜,以及来自 Ima Studio Arena 评论页面的更多背景信息。.