Sebagai mitra peluncuran bersama untuk WAN 2.6, kami di Ima Studio telah menghabiskan dua minggu terakhir untuk menguji kemampuan intinya secara menyeluruh. Hari ini menandai rilis resminya. Berdasarkan pengujian langsung dan penggunaan sehari-hari kami, kami telah menyusun panduan singkat ini untuk WAN 2.6, termasuk cara memulai uji coba gratis di Ima Studio dan cara mendapatkan hasil yang optimal dengan cepat.

Apa yang akan Anda dapatkan dari panduan ini:
- Cara tercepat untuk menghasilkan cerita mini lengkap berdurasi 10 hingga 15 detik (bukan hanya klip pendek)
- Cara menggunakan teknik bercerita multi-shot tanpa kehilangan konsistensi.
- Cara menggunakan video referensi untuk menjaga karakter tetap stabil.
- Templat petunjuk praktis yang sebenarnya kami gunakan dalam pengujian.
1) Keunggulan utama WAN 2.6 (berdasarkan pengujian kami)
Setelah menjalankan banyak perintah di berbagai skenario, kami menemukan bahwa WAN 2.6 sangat kuat ketika Anda memperlakukannya sebagai "generator video pendek lengkap" daripada hanya sebagai alat pembuatan klip sekali jalan.

Berikut adalah tiga kemampuan yang paling penting dalam pengujian kami:
Penceritaan multi-shot yang terasa seperti diedit.
Alih-alih menghasilkan satu pengambilan gambar berkelanjutan, WAN 2.6 dapat menghasilkan rangkaian yang terlihat seperti beberapa potongan dalam satu video. Dalam praktiknya, inilah perbedaan antara "klip yang indah" dan "narasi mini."“
Generasi yang mengutamakan audio (suara, dialog, dan efek suara yang memuaskan)
Jika Anda membuat storyboard untuk suara, bukan hanya visual, WAN 2.6 cenderung memberikan hasil yang lebih bersih. Kami melihat peningkatan terbesar pada:
- adegan pendek bergaya sulih suara
- momen dialog dua orang
- ASMR, memasak dengan irama musik, dan efek suara yang "diatur waktunya".
Karakter berbasis referensi (ketika konsistensi penting)
Ketika Anda membutuhkan orang, hewan peliharaan, atau karakter yang sama untuk tetap menjadi pemeran utama, input referensi adalah alur kerja yang kami rekomendasikan. Ini adalah perbedaan antara "nuansa yang serupa" dan "subjek yang jelas sama".“
2) Mulai uji coba gratis di Ima Studio (jalur tercepat)
Jika Anda hanya ingin mendapatkan hasil "wow" pertama Anda dalam hitungan menit, lakukan ini:
- Membuka WAN 2.6 di dalam Ima Studio
- Pilih salah satu mode:
- Teks ke Video jika Anda menginginkan cerita dari awal
- Gambar ke Video jika Anda sudah memiliki keyframe yang kuat
- Referensi ke Video jika Anda membutuhkan konsistensi karakter
- Pilih tujuan sederhana untuk percobaan pertama:
- Total 12 hingga 15 detik
- 3 hingga 5 tembakan, tidak lebih.
- satu subjek utama, bukan banyak subjek yang saling bersaing

Jika generasi pertama Anda terasa berantakan, biasanya bukan modelnya yang menjadi masalah. Melainkan struktur petunjuknya (kita akan memperbaikinya di bagian selanjutnya).
3) Alur kerja “kemenangan pertama” tercepat (kami menggunakan ini dalam pengujian internal)
Saat menguji model baru, kami tidak memulai dengan skrip yang rumit. Kami memulai dengan struktur yang mudah diprediksi.
Formula starter yang kami rekomendasikan
- Panjang total: 12 hingga 15 detik
- Foto-foto: 3 sampai 4
- Pengaturan tempo pengambilan gambar: 3s + 4s + 4s (+ akhiran opsional)
- Satu elemen identitas yang diulang di berbagai foto (pakaian, warna, detail yang menentukan)
Templat multi-shot siap cetak
Video sinematik vertikal 9:16, total 12–15 detik. Shot 1 (3 detik): Menetapkan subjek dan latar utama (close-up atau medium shot). Shot 2 (4 detik): Mengembangkan aksi, mempertahankan subjek yang sama, menambahkan satu detail baru. Shot 3 (4 detik): Momen penting (detail makro, slow motion, atau reaksi kunci). Shot 4 (3–4 detik): Adegan heroik terakhir, akhir yang bersih, suasana yang jelas. Gaya: (ultra realistis / anime / tanah liat / dll.) Kamera: (close-up, handheld, dolly in, slow pan) Pencahayaan: (cahaya siang lembut / cahaya tepi dramatis / malam neon) Audio: (sulih suara / dialog / musik + sinkronisasi SFX)
Mengapa ini berhasil: Hal ini memaksa model untuk "berpikir seperti seorang editor." Anda tidak hanya mendeskripsikan sebuah adegan. Anda mendeskripsikan sebuah rangkaian.
4) Bagaimana menjaga konsistensi karakter di berbagai adegan?
Ini adalah keluhan paling umum yang dialami orang-orang terkait pembuatan video multi-shot, dan juga yang paling mudah diperbaiki.
Solusinya: ulangi penanda identitas di setiap bidikan.
Alih-alih mendefinisikan karakter Anda sekali saja, ulangi 2 hingga 3 poin penting dalam setiap adegan:
- pakaian atau seragam
- gaya atau warna rambut
- properti khas (kacamata, syal, gitar, helm)
- Aturan gaya yang stabil (realisme sinematik, pewarnaan sel anime, dll.)
Contoh pengulangan jangkar
Subjek utama: seorang koki muda, celemek putih, rambut hitam pendek, senyum ramah. Adegan 1: koki muda dengan celemek putih... Adegan 2: koki muda yang sama dengan celemek putih... Adegan 3: koki muda yang sama dengan celemek putih...
Bagi manusia, hal itu tampak berulang, tetapi justru itulah yang mengurangi penyimpangan.
5) Sinkronisasi audio yang benar-benar terasa disengaja
Dalam pengujian kami, peningkatan kualitas yang paling signifikan terjadi ketika suara diperlakukan seperti garis waktu.
Pola perintah sulih suara
- jaga kebersihan suara
- jaga agar musik latar tetap pelan.
- Buatlah naskahnya singkat.
Seseorang berbicara ke kamera dengan gerakan bibir alami. Audio: sulih suara Mandarin yang jernih, musik volume rendah, kebisingan latar belakang minimal.
Pola dialog dua orang
- mendefinisikan perilaku pembicara
- buat antrean sesingkat mungkin
- meminta pemisahan dan kejelasan
Dua karakter sedang berbicara. Karakter A: nada cepat dan percaya diri. Karakter B: reaksi lebih lambat dan bingung. Audio: pemisahan yang jelas antara pembicara, suara latar alami, tidak ada musik yang mengalahkan dialog.
Pola SFX yang disinkronkan dengan ketukan
Kata-kata ajaibnya adalah penentu waktu:
- “pada ketukan pertama”
- “pada drum bass”
- “tepat pada saat jatuhnya”
- “sinkronkan setiap pukulan”
Setiap bunyi "thunk" pisau tepat mengenai ketukan drum bass. Bunyi "desis" wajan dimulai tepat pada ketukan pertama frasa synth.
6) Referensi Video: bagaimana kami mendapatkan konsistensi terbaik
Jika Anda menggunakan input referensi, aturan praktisnya sederhana:
Gunakan “karakter1 / karakter2” secara konsisten.
Tuliskan petunjuk Anda menggunakan karakter1, karakter2, dll., dan jaga agar label-label tersebut tetap stabil sepanjang perintah.
Referensi tunggal
Karakter 1 memberikan wawancara singkat di jalan kepada kamera. Jaga agar wajah dan suara karakter 1 konsisten dengan referensi. Audio: suara jernih, suasana yang halus, tanpa suara latar yang keras.
Dua referensi
Karakter 1 bernyanyi sementara karakter 2 menari di sampingnya. Pastikan kedua karakter konsisten dengan penampilan referensi.
Rekam klip referensi yang berisi informasi yang bermanfaat.
Yang paling efektif dalam pengujian kami:
- pencahayaan jernih, sudut yang bersih
- close-up + sedikit putaran pada wajah
- lebih sedikit gangguan latar belakang
- Jika Anda memperhatikan karakteristik suara, sertakan audio yang bersih.
7) Paket prompt siap cetak (yang benar-benar kami rekomendasikan)
1) Memasak multi-shot dengan SFX yang disinkronkan dengan beat (15 detik)
Cuplikan pendek memasak vertikal berdurasi 9:16, total 15 detik. Adegan 1 (3 detik): Close-up seorang koki mengiris sayuran di atas talenan kayu di bawah cahaya dapur yang terang. Adegan 2 (4 detik): Setiap "dentuman" pisau tepat mengenai suara drum bass dari lagu light house. Adegan 3 (4 detik): Bahan-bahan mengenai wajan panas; suara "desis" dimulai tepat pada ketukan pertama dari frasa synth. Adegan 4 (4 detik): Gerakan lambat melempar di wajan, uap mengepul, desain suara yang bersih, ritme yang memuaskan. Audio: musik + efek suara pemotongan dan desisan yang disinkronkan, campuran yang bersih, tanpa suara bising yang mengganggu.
2) Dialog dua orang, pengaturan waktu komedi sinematik
Adegan sinematik ultra realistis, pencahayaan samping dramatis, total 12–15 detik. Adegan 1 (4 detik): Dua prajurit terakota kuno berdiri di lubang berdebu, ketegangan yang tenang. Adegan 2 (5 detik): Prajurit A mencondongkan tubuh dan berbicara sangat cepat, nada percaya diri, gerakan bibir yang jelas. Adegan 3 (6 detik): Prajurit B bereaksi dengan ekspresi bingung, mata lebar, sedikit memiringkan kepala, pengaturan waktu komedi yang sempurna. Audio: dialog dua pembicara yang jelas, suara latar alami, tidak ada musik yang mengalahkan suara.
3) Demo produk yang terasa seperti diedit
Demo produk bersih vertikal 9:16, total 12 detik. Gambar 1 (3 detik): Produk di atas meja minimalis, cahaya siang hari lembut, bingkai close-up utama. Gambar 2 (5 detik): Tangan mendemonstrasikan fitur utama, pergerakan kamera yang halus. Gambar 3 (4 detik): Gambar utama terakhir dengan teks minimal di layar, estetika modern. Audio: musik latar ringan, efek suara klik UI yang halus, tanpa sulih suara.
4) Karakter berbasis referensi (referensi tunggal)
Karakter 1 berjalan di jalanan yang diterangi lampu neon di malam hari, bokeh sinematik, ekspresi percaya diri. Jaga agar wajah dan suara karakter 1 konsisten dengan referensi. Audio: suasana kota yang halus, tanpa latar belakang yang berisik.
8) apa yang paling sering kita perbaiki
- Penggunaan banyak bidikan terlihat kacau: kurangi menjadi 3 hingga 4 bidikan, dan buat tujuan setiap bidikan jelas.
- Pergeseran karakter: ulangi titik acuan per bidikan
- Dialog terasa berisik: minta suara yang jernih, musik yang pelan, dan suasana yang minimalis.
- SFX tidak sinkron: tentukan jangkar waktu (downbeat, kick, drop)


