मैंने Gemini के नए टास्क ऑटोमेशन को Pixel 10 Pro और Galaxy S26 Ultra पर परखा है। यह फीचर पहली बार फोन पर सीधे ऐप्स खोलकर आपके लिए काम कर सकता है। फिलहाल यह केवल कुछ फूड डिलीवरी और राइडशेयर सेवाओं तक सीमित है और बीटा स्टेज में है। चलने में यह अक्सर धीमा और कुछ मामलों में अजीब लगता है, और यह कोई बड़ा फोन-समस्या हल नहीं करता, लेकिन प्रभाव बहुत मज़ेदार है। यह देखना पहली बार जैसा था कि एक असली AI सहायक फोन पर काम कर रहा है, न कि किसी कीनोट या नियंत्रित डेमो में।
यह क्यों धीमा लगता है
सीधी बात यह है कि Gemini इंसान जितनी तेज़ी से फोन नहीं चला सकता। अगर आपको तुरंत Uber चाहिए तो आप ही सबसे तेज़ विकल्प होंगे। फिर भी, इस प्रणाली का इरादा यही है कि यह पृष्ठभूमि में चलता रहे ताकि आप फोन पर कुछ और कर सकें। अच्छी बात यह है कि यह तब भी काम करता है जब आप फोन नहीं देख रहे होते, यानी आप दूसरी चीजें कर सकते हैं और यह अपने काम को पूरा करता रहेगा।
प्रगति दिखती है
जब यह काम कर रहा होता है तो स्क्रीन के नीचे टेक्स्ट आता है जो बताता है कि Gemini क्या कर रहा है। जैसे मुझे शनिवार रात खाने का ऑर्डर करने के लिए कहा तो स्क्रीन पर दिखाई दिया कि "कंबो के लिए चिकन का दूसरा हिस्सा चुनना"। यह सही तरीके से समझ गया कि मेन्यू में परोशाइयां आधी-आधी इकाई में हैं और उसने दो आधे जोड़कर एक पूरा भाग बना दिया। ऐसे पल सचमुच प्रभाव डालते हैं।
कभी-कभी बहुत अटकता है
कभी-कभी यह चक्कर काट देता है। उदाहरण के लिए, Uber Eats के मेन्यू पर बीच में दिख रही एक साइड-डिश को ढूंढने में Gemini को परेशानी हुई जबकि वह स्क्रीन पर साफ दिख रही थी। उस सीन को देखना कुछ वैसा है जैसे कोई कंप्यूटर सोच में उलझा हो। मेरे टेरियाकी ऑर्डर में इसे सही करने में लगभग नौ मिनट लग गए। यह आदर्श नहीं है।
ऑर्डर पूरा नहीं करता जब तक आप कन्फर्म न करें
Gemini सामान्यतया ऑर्डर को अंतिम कन्फर्म करने तक नहीं भेजता। यह व्यवहार समझदारी भरा है। परीक्षण के दौरान मैंने कभी भी देखा नहीं कि इसने बिना मेरी मंजूरी के पूरा ऑर्डर भेज दिया। यह काफी सटीक रहता है और अंतिम ऑर्डर में मुझे बहुत कम बदलाव करने पड़े।
समस्याएँ कब आती हैं
- अक्सर शुरुआती एक-दो मिनट में रुकावट आती है जब ऐप अतिरिक्त परमिशन माँगता है या डिलीवरी स्थान पुराने स्थान पर सेट रहता है।
- ऐसी स्थिति में आपको समस्या बतानी पड़ती है और एक बार सही होने पर आप ऑटोमेशन को फिर से चला सकते हैं।
एक दिलचस्प उदाहरण: फ्लाइट के लिए राइड बुक करना
मैंने अपनी कैलेंडर में अगले दिन की एक फ्लाइट डाली और Gemini से कहा कि मेरे लिए एयरपोर्ट जाने वाली राइड शेड्यूल कर दे। क्योंकि Gemini को मेरी ईमेल और कैलेंडर की एक्सेस है, यह उड़ान की जानकारी ढूँढ सकता है। कभी-कभी थोड़ा मार्गदर्शन चाहिए था, शायद क्योंकि उड़ान ईमेल में नहीं थी, पर अंत में इसने उड़ान का समय पाया और सुझाया कि 11:30 या 11:45 बजे निकलना ठीक रहेगा। मैंने समय कन्फर्म किया और लगभग तीन मिनट में उसने राइड रिज़र्व कर दी।
AI आदेश करने वाला और पुराने डिजिटल असिस्टेंट में फर्क
यह ध्यान देने योग्य है कि Uber इसे "शेड्यूल" नहीं बल्कि "रिज़र्व" कहता है। नैचुरल लैंग्वेज में कंप्यूटर से बात करने की क्षमता मायने रखती है। अगर कंप्यूटर मामूली शब्दभेद पर भी फँस जाए, तो यह उतना उपयोगी नहीं रहेगा जितना होना चाहिए। Gemini के साथ बातचीत में यह फर्क दिखा कि जब शब्दों का मिलान हो जाता है तब काम तेज और सटीक होता है।
ऐप्स का मौजूदा डिजाइन और AI के लिए जरूरी बदलाव
Gemini को ऐप्स इंसानों के लिए बनाए गए इंटरफेस से काम करते देखना बताता है कि अगर ऐप्स AI के लिए डिज़ाइन किए जाएँ तो वे आज की तरह दिखेंगे ही नहीं। AI को बड़े विज्ञापन या खूबसूरत तस्वीरें प्रभावित नहीं करतीं। बेहतर दृष्टिकोण होगा कि डेवलपर्स ऐप्स के लिए एक साफ डेटाबेस या संरचित इंटरफेस दें ताकि AI सीधे और भरोसेमंद तरीके से काम कर सके। इंडस्ट्री में ऐसे मानकों की दिशा में काम हो रहा है, और यही अगले कदम होना चाहिए।
निष्कर्ष
Gemini का टास्क ऑटोमेशन अभी कच्चा महसूस होता है। यह सुस्त और कभी-कभी अटकता है, पर यह स्पष्ट संकेत देता है कि मोबाइल असिस्टेंट का भविष्य कैसा दिखेगा। यह एक शुरुआती परफॉर्मेंस है जो बताती है कि सही दिशा में काम हो रहा है। धीरे-धीरे, जब ऐप डेवलपर्स और प्लेटफार्म AI-फ्रेंडली विकल्प अपनाएँगे, तब यह और अधिक उपयोगी और तेज़ होगा। फिलहाल यह अजीब, धीमा, पर प्रभावशाली नमूना है।