
समग्र विजेता
सोरा-2-प्रो कुल स्कोर में आगे है: 74.63% बनाम 73.20% (+1.43pp)।.
नियंत्रण, रचनात्मकता और मल्टी-व्यू के लिए सर्वश्रेष्ठ
क्लिंग-वी2-5-टर्बो नियंत्रणीयता और रचनात्मक निर्देशन के मामले में बेहतर प्रदर्शन करता है, और मल्टी-व्यू स्थिरता के मामले में कहीं अधिक मजबूत है: नियंत्रणीयता +7.30pp, रचनात्मकता +6.66pp, मल्टी-व्यू स्थिरता +36.43pp।.
मानवीय यथार्थवाद और पहचान की संगति के लिए सर्वोत्तम
सोरा-2-प्रो यथार्थवादी मनुष्यों के लिए और शॉट्स में एक ही चरित्र को सुसंगत रखने के लिए बेहतर प्रदर्शन करता है: मानव निष्ठा +16.30pp, मानव पहचान +33.91pp, मानव शरीर रचना +14.97pp।.
नवीनतम VBench-IBench परिणामों के आधार पर, समग्र स्कोर और मुख्य आयामों के आधार पर सारांशित किया गया है।.
| मीट्रिक | सोरा-2-प्रो | क्लिंग-वी2-5-टर्बो | विजेता |
|---|---|---|---|
| कुल स्कोर | 74.63% | 73.20% | सोरा (+1.43 पृष्ठ) |
| रचनात्मकता | 77.41% | 84.07% | क्लिंग (+6.66 पृष्ठ) |
| व्यावहारिक बुद्धि | 88.89% | 83.33% | सोरा (+5.56 पृष्ठ) |
| controllability | 58.41% | 65.71% | क्लिंग (+7.30 पृष्ठ) |
| मानव निष्ठा | 87.87% | 71.57% | सोरा (+16.30 पृष्ठ) |
| भौतिक विज्ञान | 60.56% | 61.33% | क्लिंग (+0.77pp) |
सबसे बड़े स्कोर अंतरों को बारीक मापदंडों के आधार पर विभाजित करके दिखाया गया है — ताकि आप समझ सकें कि अंतर कहां से आ रहा है।.
| बारीक मीट्रिक | सोरा-2-प्रो | क्लिंग-वी2-5-टर्बो | Δ (पीपी) | इसका क्या मतलब है |
|---|---|---|---|---|
| बहु-दृश्य संगति | 20.00% | 56.43% | +36.43 | विभिन्न कोणों/कैमरा दृश्यों में एकरूपता |
| मानव पहचान | 74.51% | 40.60% | +33.91 (सोरा) | क्या एक ही व्यक्ति लगातार एक जैसा दिखता है? |
| सामग्री | 77.78% | 44.44% | +33.34 (सोरा) | सामग्रियों (कपड़ा/धातु/कांच) का यथार्थवाद |
| गतिशील विशेषता | 55.56% | 88.89% | +33.33 | गति संबंधी विशेषताओं (मुद्रा/अभिव्यक्ति) में परिवर्तन |
| जटिल कथानक | 68.89% | 37.78% | +31.11 (सोरा) | जटिल दृश्यों में कथात्मक सुसंगति |
| प्रस्ताव आदेश की समझ | 77.78% | 100.00% | +22.22 | चरण दर चरण गति क्रम का पालन करें |
* Δ(pp) प्रतिशत-बिंदु अंतर है। लेबल (सोरा/क्लिंग) अग्रणी मॉडल को दर्शाता है।.
मानदंड की त्वरित व्याख्या — वास्तविक परियोजनाओं में प्रत्येक मॉडल किसके लिए बेहतर उपयुक्त है।.
अपना लक्ष्य चुनें — हम बेंचमार्क खूबियों के आधार पर सर्वोत्तम मॉडल की अनुशंसा करते हैं।.
मानवीय यथार्थता, पहचान की निरंतरता और शारीरिक संरचना की स्थिरता के लिए बेहतर परिणाम - क्लोज-अप शॉट्स और बार-बार आने वाले पात्रों के लिए आदर्श।.
उच्च रचनात्मकता स्कोर, साहसिक कला निर्देशन और शैलीबद्ध, ध्यान खींचने वाले शॉट्स के लिए बेहतर उपयुक्त है।.
बेहतर नियंत्रण क्षमता और कार्यों के क्रम को बेहतर ढंग से समझने की क्षमता — सटीक निर्देशों का पालन करने की आवश्यकता होने पर यह बहुत उपयोगी है।.
बेहतर व्यावहारिक समझ और जटिल कथानक को संभालने की क्षमता — कई दृश्यों में सुसंगत कहानी कहने के लिए बेहतर है।.
मल्टी-व्यू कंसिस्टेंसी में बड़ी बढ़त — विषय को स्थिर रखते हुए कैमरा एंगल बदलने के लिए सबसे अच्छा।.
उच्च गति तर्कसंगतता — कम अप्राकृतिक कलाकृतियों के साथ अधिक स्थिर भौतिक व्यवहार।.
इस तुलना और बेंचमार्क सेटअप के बारे में सबसे आम सवालों के त्वरित उत्तर।.
यह पृष्ठ निम्नलिखित का उपयोग करके मॉडल की खूबियों का सारांश प्रस्तुत करता है: वीबेंच बेंचमार्क फ्रेमवर्क और इसका सार्वजनिक लीडरबोर्ड, साथ ही इमा स्टूडियो एरेना समीक्षा पृष्ठ से अतिरिक्त संदर्भ।.
आप आधिकारिक रूपरेखा और सार्वजनिक लीडरबोर्ड की समीक्षा यहाँ कर सकते हैं: