
総合優勝者
合計スコアではSora-2-Proがリードしています: 74.63% vs 73.20% (+1.43pp)。.
コントロール、創造性、マルチビューに最適
Kling-v2-5-Turbo は、制御性と創造性の方向性において優れたパフォーマンスを発揮し、マルチビューの安定性が大幅に向上しました: 制御性 +7.30pp、創造性 +6.66pp、マルチビューの一貫性 +36.43pp。.
人間のリアリズムとアイデンティティの一貫性に最適
Sora-2-Pro は、リアルな人間とショット間で同じキャラクターの一貫性を保つ点で優れたパフォーマンスを発揮します: 人間の忠実度 +16.30pp、人間のアイデンティティ +33.91pp、人間の解剖学 +14.97pp。.
最新の VBench-IBench 結果に基づき、全体のスコアとコアディメンション別にまとめられています。.
| メトリック | ソラ2プロ | クリングv2-5ターボ | 勝者 |
|---|---|---|---|
| 合計スコア | 74.63% | 73.20% | ソラ(+1.43pp) |
| 創造性 | 77.41% | 84.07% | クリング(+6.66pp) |
| 常識 | 88.89% | 83.33% | ソラ(+5.56pp) |
| 制御性 | 58.41% | 65.71% | クリング(+7.30pp) |
| 人間の忠誠心 | 87.87% | 71.57% | ソラ(+16.30pp) |
| 物理 | 60.56% | 61.33% | クリング(+0.77pp) |
最も大きなスコアの差を細かい指標で分類して、その差がどこから生じているのかを確認できます。.
| きめ細かなメトリック | ソラ2プロ | クリングv2-5ターボ | Δ(pp) | それが意味するもの |
|---|---|---|---|---|
| マルチビューの一貫性 | 20.00% | 56.43% | +36.43 | 複数の角度/カメラビューにわたる一貫性 |
| 人間のアイデンティティ | 74.51% | 40.60% | +33.91(ソラ) | 同じ人物が一貫して見えるかどうか |
| 材料 | 77.78% | 44.44% | +33.34(ソラ) | 素材のリアルさ(布地・金属・ガラス) |
| 動的属性 | 55.56% | 88.89% | +33.33 | モーション属性(ポーズ・表情)の変更 |
| 複雑なプロット | 68.89% | 37.78% | +31.11(ソラ) | 複雑な場面における物語の一貫性 |
| 動作順序の理解 | 77.78% | 100.00% | +22.22 | ステップバイステップの動作順序に従う |
* Δ(pp)はパーセンテージポイント差です。ラベル(Sora/Kling)は、リードモデルを示しています。.
ベンチマークの簡単な解釈 - 実際のプロジェクトで各モデルが何に適しているか。.
目標を選択してください。ベンチマークの強みに基づいて最適なモデルをお勧めします。.
人間のリアリティ、アイデンティティの一貫性、解剖学的安定性が向上します。クローズアップや繰り返し登場するキャラクターに最適です。.
創造性スコアが高く、大胆なアートディレクションや、注目を集めるスタイリッシュなショットに適しています。.
制御性が向上し、アクション順序の理解が強化されます。正確な指示の遵守が必要な場合に最適です。.
より強力な常識と複雑なプロット処理により、複数のショットにわたる一貫したストーリーテリングが向上します。.
マルチビューの一貫性が大きくリードしており、被写体の一貫性を保ちながらカメラアングルを切り替えるのに最適です。.
より高い動作合理性 - 不自然なアーティファクトが少なくなり、物理的な動作がより安定します。.
この比較とベンチマーク設定に関する最も一般的な質問への簡単な回答。.
このページでは、 Vベンチ ベンチマーク フレームワークとその公開リーダーボード、および Ima Studio Arena のレビュー ページからの追加コンテキスト。.
公式フレームワークと公開リーダーボードはここで確認できます: