Moshi AI Chatbot With Real-Time Voice Features Launched by Kyutai Labs as GPT-4o Rival
क्युटाई लैब्स ने बुधवार को मोशी एआई लॉन्च किया, जो एक आर्टिफिशियल इंटेलिजेंस (एआई) चैटबॉट है जो वास्तविक समय में मौखिक रूप से प्रतिक्रिया देता है। फ्रांसीसी एआई फर्म ने घोषणा की है कि मोशी का संपूर्ण ऑडियो भाषा मॉडल इन-हाउस विकसित किया गया था। यह भावनाओं को व्यक्त करने और विभिन्न बोलने की शैलियों में प्रतिक्रिया देने के लिए आवाज़ को भी संशोधित कर सकता है। एआई मॉडल को जनता द्वारा मुफ्त में एक्सेस किया जा सकता है। वर्तमान में, एआई मॉडल बातचीत को पाँच मिनट तक सीमित रखता है। दिलचस्प बात यह है कि ओपनएआई ने GPT-4o की रिलीज़ के साथ इसी तरह की स्पीच सुविधाओं की भी घोषणा की, लेकिन इसे अभी रिलीज़ किया जाना बाकी है।
मोशी एआई विशेषताएं
कंपनी का कहना है कि आठ लोगों की टीम के साथ छह महीने में एआई मॉडल विकसित किया गया था। पेरिस में एक कार्यक्रम में एआई मॉडल का अनावरण करते हुए, क्युटाई लैब्स ने कहा कि मोशी एक एआई सहायक नहीं है, बल्कि एक प्रोटोटाइप है जिसका उपयोग विभिन्न उपयोग मामलों के लिए उपकरण विकसित करने के लिए किया जा सकता है। इसने चैटबॉट को यहां सार्वजनिक रूप से उपलब्ध भी कराया है। उपयोगकर्ता अपना ईमेल दर्ज कर सकते हैं और कतार में शामिल हो सकते हैं, लेकिन गैजेट्स 360 के कर्मचारी बिना किसी प्रतीक्षा समय के प्लेटफ़ॉर्म तक तुरंत पहुँच प्राप्त करने में सक्षम थे।
कल हमने मोशी को पेश किया, जो अब तक जारी किया गया सबसे कम विलंबता वाला संवादी AI है। मोशी छोटी-छोटी बातें कर सकता है, विभिन्न अवधारणाओं को समझा सकता है, कई भावनाओं और बोलने की शैलियों में भूमिका निभा सकता है। https://t.co/a4EbAQiih7 पर मोशी से बात करें और नीचे दिए गए तरीके के बारे में अधिक जानें 🧵. pic.twitter.com/NkJRybTRLQ
— क्युताई (@kyutai_labs) 4 जुलाई, 2024
प्लेटफ़ॉर्म इंटरफ़ेस काफी सरल है। इसमें एक सरलीकृत AI डिज़ाइन है जहाँ उपयोगकर्ता बोलते समय अपनी आवाज़ की ज़ोर की जाँच कर सकते हैं। एक टेक्स्ट बॉक्स है जहाँ केवल AI की प्रतिक्रियाएँ दिखाई देती हैं। शीर्ष के पास एक और बॉक्स तकनीकी विवरण प्रदर्शित करता है जैसे कि ऑडियो अवधि, विलंबता और छूटी हुई ऑडियो।
सबसे ऊपर, कॉल को डिस्कनेक्ट करने के लिए एक बटन है। वर्तमान में, अधिकतम कॉल अवधि पांच मिनट हो सकती है। विवरण पृष्ठ पर बताया गया है कि मोशी बातचीत के प्रवाह को अधिकतम करने के लिए एक ही समय में सोच, बोल और सुन सकता है।
गैजेट्स 360 ने पाया कि विलंबता बेहद कम है, और AI अक्सर तुरंत प्रतिक्रिया देता है। हालांकि, कुछ ऐसे उदाहरण हैं जहां प्रतिक्रिया समय में देरी 10-15 सेकंड से अधिक हो सकती है। लेकिन यह भारी सर्वर लोड के कारण हो सकता है। हालांकि, कभी-कभी वॉल्यूम मीटर के तीन-चौथाई भर जाने के बाद भी मौखिक संकेत बिल्कुल भी पंजीकृत नहीं होते थे।
गैजेट्स 360 ने यह भी पाया कि AI मॉडल भावनात्मक आवाज़ में जवाब दे सकता है, और विभिन्न शैलियों में और विभिन्न आवाज़ मॉड्यूलेशन का उपयोग करके बोल सकता है। AI मॉडल इंटरनेट से भी जुड़ा हुआ है और वेब को देखने की आवश्यकता वाले प्रश्नों के उत्तर प्राप्त कर सकता है। विशेष रूप से, चैटबॉट टेक्स्ट प्रॉम्प्ट की अनुमति नहीं देता है, और इसके साथ बातचीत करने के लिए आवाज़ ही एकमात्र माध्यम है।
क्युटाई लैब्स ने कहा है कि एआई मॉडल ओपन-सोर्स होगा। हालाँकि, एआई फर्म ने अभी तक मॉडल वेट और कोड को पोर्टल पर होस्ट नहीं किया है। उपलब्ध होने के बाद, उपयोगकर्ता इसे स्थानीय रूप से डाउनलोड और इंस्टॉल कर सकेंगे, और इसे किसी अनकनेक्टेड डिवाइस पर चलाया जा सकेगा।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
भारत में लॉन्च से पहले लावा ब्लेज़ एक्स 5G की कीमत लीक; मीडियाटेक डाइमेंशन 7050 SoC से लैस होने की उम्मीद