November 7, 2024
A.I

Moshi AI Chatbot With Real-Time Voice Features Launched by Kyutai Labs as GPT-4o Rival

  • August 18, 2024
  • 1 min read
Moshi AI Chatbot With Real-Time Voice Features Launched by Kyutai Labs as GPT-4o Rival

क्युटाई लैब्स ने बुधवार को मोशी एआई लॉन्च किया, जो एक आर्टिफिशियल इंटेलिजेंस (एआई) चैटबॉट है जो वास्तविक समय में मौखिक रूप से प्रतिक्रिया देता है। फ्रांसीसी एआई फर्म ने घोषणा की है कि मोशी का संपूर्ण ऑडियो भाषा मॉडल इन-हाउस विकसित किया गया था। यह भावनाओं को व्यक्त करने और विभिन्न बोलने की शैलियों में प्रतिक्रिया देने के लिए आवाज़ को भी संशोधित कर सकता है। एआई मॉडल को जनता द्वारा मुफ्त में एक्सेस किया जा सकता है। वर्तमान में, एआई मॉडल बातचीत को पाँच मिनट तक सीमित रखता है। दिलचस्प बात यह है कि ओपनएआई ने GPT-4o की रिलीज़ के साथ इसी तरह की स्पीच सुविधाओं की भी घोषणा की, लेकिन इसे अभी रिलीज़ किया जाना बाकी है।

मोशी एआई विशेषताएं

कंपनी का कहना है कि आठ लोगों की टीम के साथ छह महीने में एआई मॉडल विकसित किया गया था। पेरिस में एक कार्यक्रम में एआई मॉडल का अनावरण करते हुए, क्युटाई लैब्स ने कहा कि मोशी एक एआई सहायक नहीं है, बल्कि एक प्रोटोटाइप है जिसका उपयोग विभिन्न उपयोग मामलों के लिए उपकरण विकसित करने के लिए किया जा सकता है। इसने चैटबॉट को यहां सार्वजनिक रूप से उपलब्ध भी कराया है। उपयोगकर्ता अपना ईमेल दर्ज कर सकते हैं और कतार में शामिल हो सकते हैं, लेकिन गैजेट्स 360 के कर्मचारी बिना किसी प्रतीक्षा समय के प्लेटफ़ॉर्म तक तुरंत पहुँच प्राप्त करने में सक्षम थे।

प्लेटफ़ॉर्म इंटरफ़ेस काफी सरल है। इसमें एक सरलीकृत AI डिज़ाइन है जहाँ उपयोगकर्ता बोलते समय अपनी आवाज़ की ज़ोर की जाँच कर सकते हैं। एक टेक्स्ट बॉक्स है जहाँ केवल AI की प्रतिक्रियाएँ दिखाई देती हैं। शीर्ष के पास एक और बॉक्स तकनीकी विवरण प्रदर्शित करता है जैसे कि ऑडियो अवधि, विलंबता और छूटी हुई ऑडियो।

सबसे ऊपर, कॉल को डिस्कनेक्ट करने के लिए एक बटन है। वर्तमान में, अधिकतम कॉल अवधि पांच मिनट हो सकती है। विवरण पृष्ठ पर बताया गया है कि मोशी बातचीत के प्रवाह को अधिकतम करने के लिए एक ही समय में सोच, बोल और सुन सकता है।

गैजेट्स 360 ने पाया कि विलंबता बेहद कम है, और AI अक्सर तुरंत प्रतिक्रिया देता है। हालांकि, कुछ ऐसे उदाहरण हैं जहां प्रतिक्रिया समय में देरी 10-15 सेकंड से अधिक हो सकती है। लेकिन यह भारी सर्वर लोड के कारण हो सकता है। हालांकि, कभी-कभी वॉल्यूम मीटर के तीन-चौथाई भर जाने के बाद भी मौखिक संकेत बिल्कुल भी पंजीकृत नहीं होते थे।

मोशी ऐ आवाज़ मोशी ऐ

मोशी एआई इंटरफ़ेस
फोटो क्रेडिट: क्युताई लैब्स

गैजेट्स 360 ने यह भी पाया कि AI मॉडल भावनात्मक आवाज़ में जवाब दे सकता है, और विभिन्न शैलियों में और विभिन्न आवाज़ मॉड्यूलेशन का उपयोग करके बोल सकता है। AI मॉडल इंटरनेट से भी जुड़ा हुआ है और वेब को देखने की आवश्यकता वाले प्रश्नों के उत्तर प्राप्त कर सकता है। विशेष रूप से, चैटबॉट टेक्स्ट प्रॉम्प्ट की अनुमति नहीं देता है, और इसके साथ बातचीत करने के लिए आवाज़ ही एकमात्र माध्यम है।

क्युटाई लैब्स ने कहा है कि एआई मॉडल ओपन-सोर्स होगा। हालाँकि, एआई फर्म ने अभी तक मॉडल वेट और कोड को पोर्टल पर होस्ट नहीं किया है। उपलब्ध होने के बाद, उपयोगकर्ता इसे स्थानीय रूप से डाउनलोड और इंस्टॉल कर सकेंगे, और इसे किसी अनकनेक्टेड डिवाइस पर चलाया जा सकेगा।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए, गैजेट्स 360 को फ़ॉलो करें एक्सFacebook, WhatsApp, थ्रेड्स और Google News. गैजेट्स और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल को सब्सक्राइब करें। यदि आप शीर्ष प्रभावशाली लोगों के बारे में सब कुछ जानना चाहते हैं, तो Instagram और YouTube पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।

भारत में लॉन्च से पहले लावा ब्लेज़ एक्स 5G की कीमत लीक; मीडियाटेक डाइमेंशन 7050 SoC से लैस होने की उम्मीद



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *