Deep Voodoo: ब्रिक वॉल, कैमरे और एक अलग किस्म की AI फैक्ट्री
वेनिस, लॉस एंजेलिस के एक प्रोफेशनली लाइटेड, ईंटों वाली जगह में अभिनेता आते हैं, फोटो और वीडियो शूट करवाते हैं और फिर निकल जाते हैं। बाहर से यह शहर के बाकी स्टूडियो शोज जैसा ही लगता है। अंदर कहानी दूसरी है। कैमरा बंद होते ही Deep Voodoo उस फुटेज को डेटा में बदल देता है, फिर उसे दुनिया भर में फैले AI मॉडल विशेषज्ञों के पास भेजता है। कोई पूर्वी यूरोप में, कोई अर्जेंटीना में, कोई वैंकूवर में। इसके बाद कंप्यूटिंग संसाधनों और ट्रेनिंग के जरिए वह डेटा किसी काम का synthetic नतीजा बनता है। कभी उम्र घटाई हुई चेहरे की परत, कभी deepfake, कभी कोई और ऐसा विजुअल जो मनोरंजन की जरूरतों के हिसाब से गढ़ा गया हो।
अगर यह सब अपने आप में काफी दिलचस्प नहीं लगता, तो इसमें Trey Parker और Matt Stone का जुड़ना इसे और भी अजीब तरह से रोचक बना देता है। वही जोड़ी जिसने South Park और The Book of Mormon जैसे प्रोजेक्ट्स से अक्सर सीमा रेखाओं को चिढ़ाया है, अब AI के एक अपेक्षाकृत संयमित, और कुछ हद तक आश्चर्यजनक रूप से जिम्मेदार, उपयोग की तरफ बढ़ रही है।
कंपनी की शुरुआत Donald Trump से हुई
Deep Voodoo असल में कंपनी बनने के लिए बनी ही नहीं थी। इसकी शुरुआत Trump से हुई।
पहले Trump प्रशासन के दौरान Parker और Stone एक Donald Trump deepfake फिल्म विकसित कर रहे थे। योजना थी कि किसी दूसरे अभिनेता के शरीर पर Trump का चेहरा चिपकाया जाए, फिर उसे धीरे-धीरे मानसिक रूप से बिखरता दिखाया जाए, और अंत में कपड़ों से भी मुक्त कर दिया जाए। लेकिन उन्हें स्टूडियो से वह स्तर की तकनीक नहीं मिल रही थी जो वे चाहते थे। Matt Stone के मुताबिक, कुछ visual effects houses ने उन्हें टालमटोल वाला जवाब दिया। और फिर वही पुराना उद्योगी नियम काम आया: जब बाहर से समाधान नहीं मिलता, तो लोग खुद समाधान बनाते हैं।
उन्होंने इंटरनेट पर लोगों को खोजा, AI के जानकार कुछ युवाओं को इकट्ठा किया और खुद की एक इकाई बना ली। फिल्म शायद आगे नहीं बढ़ी, क्योंकि covid ने उसे रोक दिया। लेकिन टीम बनी रही। उसी से Sassy Justice नाम की वेब सीरीज निकली, जिसमें सार्वजनिक हस्तियों की पैरोडी की गई। उस 14 मिनट के एपिसोड में deepfaked Trump था और वह वायरल हो गया। 2026 से देखें तो उस समय के विजुअल और ऑडियो थोड़े खुरदरे लग सकते हैं। 2021 में वे काफी बगावती थे। इतना कि Parker और Stone ने उनमें से कुछ काम बाद में South Park के जुलाई सीजन ओपनर में भी इस्तेमाल किया।
आखिरकार यही सब एक कंपनी में बदल गया। 2022 के अंत तक Deep Voodoo ने 20 मिलियन डॉलर जुटा लिए थे। वह भी ऐसे समय में जब हॉलीवुड में AI को लेकर इतनी गंभीर चर्चा अभी शुरू भी नहीं हुई थी।
कम दिखावा, ज्यादा नियंत्रण
Deep Voodoo की सबसे खास बात इसका कम प्रोफाइल रखना है। कंपनी के दो शीर्ष लोग भी उसी अंदाज़ के हैं। Jennifer Howell, जो पहले South Park प्रोड्यूस कर चुकी हैं और शहर के कई स्टूडियो में काम कर चुकी हैं, इसकी chief content officer हैं। CEO Afshin Beyzaee हैं, जो दिखावे वाले टेक-गुरु कम और पार्क-काउंटी के पुराने वकील ज्यादा लगते हैं। वे वर्षों तक Parker और Stone की Park County production company में chief counsel रहे।
न तो Howell और न ही Beyzaee Silicon Valley वाले लंबे-चौड़े दावों में रुचि रखते हैं। Beyzaee साफ कहते हैं कि किसी की likeness का बिना अनुमति इस्तेमाल करना अनुचित है। कोई कयामती मार्केटिंग नहीं, कोई “हम इंटरनेट को हिला देंगे” वाला शोर नहीं। और शायद यही Parker और Stone को पसंद है। जिस तकनीक से पहले ही काफी लोग चिढ़े हुए हैं, उसमें कंपनी का Mr. Mackey जैसी शांति अपनाना कम से कम सुसंगत तो है।
Deep Voodoo खास तौर पर licensing पर जोर देती है। कंपनी ऐसे किसी studio के साथ काम नहीं करेगी जिसने actors या estates से अनुमति नहीं ली हो। Donald Trump वाले deepfake के मामले में White House की अनुमति नहीं थी, लेकिन executives का कहना है कि उन्होंने व्यापक public, fair-use images पर भरोसा किया।
Beyzaee के शब्दों में, जब कुछ लोग IP का लाइसेंस लेकर उपयोग कर रहे हैं और कुछ नहीं, तो बाकी लोग पूछते हैं कि वे क्यों भुगतान करें। Deep Voodoo का जवाब है कि वह सेवा और तकनीक ऐसी तरह से देनी चाहिए जो कानून, अधिकार और अनुमति का सम्मान करे। अगर permission का स्तर पर्याप्त नहीं है, तो वे काम ठुकरा भी देते हैं। हॉलीवुड में यह व्यवहार लगभग विद्रोही-सा लगता है।
वे डेटा नहीं, प्रदर्शन खरीदते हैं
Deep Voodoo की कार्यप्रणाली बाकी AI कंपनियों से अलग है। यह इंटरनेट से तस्वीरें खंगालकर मॉडल नहीं बनाती। इसके बजाय वह लाइसेंस प्राप्त images का इस्तेमाल करती है, या तो अपने वेनिस वाले स्पेस में, या प्रोडक्शन कंपनी से मिली सामग्री के जरिए। वहां नौ कैमरों से capture किया जाता है और कलाकारों से साधारण सवाल पूछकर चेहरे के अलग-अलग भाव लिए जाते हैं। फिर इन्हीं सामग्रियों से किसी खास प्रोडक्शन के लिए एक bespoke मॉडल तैयार होता है।
यह काम धीमा है। एक बार के उपयोग के लिए इतना धीमा कि किसी scale-obsessed Silicon Valley कंपनी को शायद यह बहुत झंझट लगे। इसमें एक महीने तक लग सकता है और करीब 300,000 images भी लग जाती हैं। लेकिन नतीजा कानूनी भी होता है और जरूरत के हिसाब से बना भी होता है। Beyzaee के मुताबिक, मुद्दा यह नहीं है कि इंटरनेट से कुछ उठा लिया जाए और मॉडल में डाल दिया जाए।
यहां उदाहरण भी मौजूद हैं। 2024 में Billy Joel के comeback single “Turn The Lights Back On” के वीडियो के लिए उनकी उम्र कम की गई और फिर वापस बढ़ाई गई। वीडियो में उनके करियर के अलग-अलग दौरों के बीच कट इतना सहज था क्योंकि वह footage खास उसी काम के लिए बनाया गया था, न कि किसी सस्ते डिजिटल जुगाड़ से निकाला गया था। Howell के शब्दों में, उनका लक्ष्य सुंदर, cinematic फिल्म और टेलीविजन बनाना है जो दर्शक को बाहर न खींचे, क्योंकि effect गलत नहीं लगना चाहिए। उनके अनुसार, यह सोच इसलिए भी है क्योंकि कंपनी की नींव उन्हीं कलाकारों ने रखी है जो बेहद picky हैं।
आलोचना, लेकिन अपनी शर्तों पर
कई अभिनेता और लेखक AI को लेकर शक और नाराज़गी रखते हैं। Deep Voodoo की टीम का मानना है कि उस गुस्से का बड़ा हिस्सा prompt-based AI पर जाना चाहिए, जहां कोई व्यक्ति सिर्फ निर्देश टाइप करता है और बाहर से content निकल आता है, अक्सर बिना कलाकार को केंद्र में रखे। उनकी प्रक्रिया अलग है। यहां आम तौर पर एक वास्तविक performer मौजूद होता है, मानो चेहरे का मास्क पहनकर काम कर रहा हो।
Stone साफ कहते हैं कि उनका तरीका उस synthetic, Tilly Norwood-शैली वाले दृष्टिकोण जैसा नहीं है जिसने रचनात्मक समुदाय को बेचैन किया है। वे न तो prompt टाइप कर रहे हैं, न कलाकार को हटाकर सब कुछ मशीन पर छोड़ रहे हैं। उनके शब्दों में, “magic” performer में है। Puppet tool से अच्छा बन सकता है, लेकिन बिना performer के वह बस wallpaper बन जाता है।
आगे क्या हो सकता है
Stone को लगता है कि AI के उपयोग अभी बस शुरू ही हुए हैं। उनके मुताबिक, कोई इस तकनीक से डरावनी horror फिल्म बनाएगा, कोई बहुत मजेदार comedy, और कोई ऐसा राजनीतिक शो जो बेहद वर्तमान होगा। उस शो में deepfakes का इस्तेमाल सिर्फ किसी व्यक्ति जैसा दिखने के लिए नहीं, बल्कि किसी grotesque mashup के लिए भी हो सकता है, ताकि किसी की छवि का टुकड़ा पकड़कर एक अजीब, phantasmagoric चरित्र बनाया जा सके। उनका अनुमान है कि ऐसा शो SNL जैसी साप्ताहिक या द्विसाप्ताहिक गति से भी हो सकता है।
De-aging अभी भी Deep Voodoo का बड़ा उपयोग है, लेकिन Howell और Stone एक और संभावनाशील क्षेत्र की बात करते हैं, जिसे “performance transfer” कहा जाता है। इसमें अभिनेता साधारण कपड़ों में, कम शूटिंग के साथ मंच पर अपना प्रदर्शन करता है, और बाद में वह प्रदर्शन इस तरह स्थानांतरित किया जाता है कि दर्शक को लगे कि वह पेरिस की सड़कों पर टीम के साथ दौड़ रहा था या बीजिंग में किसी तीखी मुठभेड़ में था। इसे आप एक तरह का त्रिआयामी ADR कह सकते हैं, अगर उद्योग को और भी तकनीकी शब्दों की जरूरत हो तो।
इससे प्रोडक्शन तेज और सस्ता हो सकता है। यूरोप या एशिया में बड़े सितारों और भारी क्रू को भेजने की जरूरत कम पड़ सकती है। Stone के मुताबिक, इसका असर प्रोडक्शन के कई हिस्सों पर पड़ेगा। हां, यह शारीरिक क्रू और उन शहरों को खुश नहीं करेगा जो शूट्स खींचने के लिए अपनी बुनियादी पहचान ही बेचते हैं। वे मानते हैं कि deepfakes, भले ही Deep Voodoo के मामले में satirical लेबल के साथ इस्तेमाल हों, ऑनलाइन अविश्वास को बढ़ा भी सकते हैं।
फिर भी Stone का भरोसा है कि लाभ, हानियों से कहीं ज्यादा होंगे। उनके हिसाब से कुछ guardrails तो चाहिए, लेकिन दीवारें नहीं खड़ी की जा सकतीं। यह तकनीक मौजूद है, टीवी पर इसका इस्तेमाल पहले से हो रहा है, और यह उद्योग को बदलने वाली है।
और वह बड़ा, अनकहा सवाल भी है: क्या South Park में इसका इस्तेमाल होगा? Stone को लगता है कि होगा। हर दो हफ्ते में शो बनाना, उनके मुताबिक, कुछ हद तक उनकी उम्र का असर है, लेकिन तकनीक इससे मदद भी करेगी। इसका मतलब हो सकता है कि वे जल्दी घर जाएं, उनके पास ज्यादा विकल्प हों, और शायद शो भी थोड़ा बेहतर हो जाए। हॉलीवुड के लिहाज से यह वाकई एक असामान्य वादा है: कम समय, ज्यादा विकल्प और शायद कम गड़बड़।