
Vainqueur général
Sora-2-Pro est en tête au niveau du score total : 74,63% contre 73,20% (+1,43pp).
Idéal pour le contrôle, la créativité et le multi-affichage
Kling-v2-5-Turbo offre de meilleures performances en matière de contrôlabilité et de direction créative, et est beaucoup plus performant en matière de stabilité multi-vues : Contrôlabilité +7,30pp, Créativité +6,66pp, Cohérence multi-vues +36,43pp.
Idéal pour le réalisme humain et la cohérence de l'identité
Sora-2-Pro offre de meilleures performances pour les humains réalistes et pour maintenir le même personnage cohérent d'un plan à l'autre : Fidélité humaine +16,30pp, Identité humaine +33,91pp, Anatomie humaine +14,97pp.
D’après les derniers résultats VBench-IBench, résumés par score global et dimensions principales.
| Métrique | Sora-2-Pro | Kling-v2-5-Turbo | Gagnant |
|---|---|---|---|
| Score total | 74.63% | 73.20% | Sora (+1,43pp) |
| Créativité | 77.41% | 84.07% | Kling (+6,66pp) |
| bon sens | 88.89% | 83.33% | Sora (+5,56pp) |
| Contrôlabilité | 58.41% | 65.71% | Kling (+7,30pp) |
| Fidélité humaine | 87.87% | 71.57% | Sora (+16,30pp) |
| Physique | 60.56% | 61.33% | Kling (+0,77pp) |
Les plus grands écarts de scores, analysés en détail grâce à des indicateurs précis — vous permettant ainsi de voir d'où vient la différence.
| Métrique à grain fin | Sora-2-Pro | Kling-v2-5-Turbo | Δ (pp) | Ce que cela signifie |
|---|---|---|---|---|
| Cohérence multi-vues | 20.00% | 56.43% | +36.43 | Cohérence sur plusieurs angles de vue / vues de caméra |
| Identité humaine | 74.51% | 40.60% | +33,91 (Sora) | Qu'une même personne ait une apparence cohérente |
| Matériel | 77.78% | 44.44% | +33,34 (Sora) | Réalisme des matériaux (tissu / métal / verre) |
| Attribut dynamique | 55.56% | 88.89% | +33.33 | Modifications des attributs de mouvement (pose / expression) |
| Intrigue complexe | 68.89% | 37.78% | +31.11 (Sora) | Cohérence narrative dans des scènes complexes |
| Compréhension de l'ordre de motion | 77.78% | 100.00% | +22.22 | En suivant l'ordre des mouvements étape par étape |
* Δ(pp) représente la différence en points de pourcentage. L'étiquette (Sora/Kling) indique le modèle dominant.
Interprétation rapide du référentiel — à quoi chaque modèle est le mieux adapté dans des projets réels.
Choisissez votre objectif — nous vous recommandons le meilleur modèle en fonction de ses points forts de référence.
Des résultats plus convaincants en matière de réalisme humain, de cohérence de l'identité et de stabilité anatomique — idéal pour les gros plans et les personnages récurrents.
Score de créativité plus élevé, mieux adapté à une direction artistique audacieuse et à des prises de vue stylisées et accrocheuses.
Une meilleure maîtrise et une compréhension plus fine des ordres d'action — un atout précieux lorsque le respect précis des instructions est indispensable.
Un bon sens plus aiguisé et une gestion plus efficace des intrigues complexes — un atout pour une narration cohérente à travers plusieurs plans.
Grande avance en matière de cohérence multi-vues — idéal pour changer d'angle de caméra tout en conservant le même sujet.
Une rationalité de mouvement plus élevée — un comportement physique plus stable avec moins d'artefacts artificiels.
Réponses rapides aux questions les plus fréquentes concernant cette comparaison et la configuration du banc d'essai.
Cette page résume les points forts du modèle en utilisant VBench Cadre de référence et son classement public, avec un contexte supplémentaire tiré de la page de test d'Ima Studio Arena.
Vous pouvez consulter le cadre officiel et le classement public ici :