ElevenLabs Releases AI-Powered Voice Design API and X to Voice Features
न्यूयॉर्क स्थित कृत्रिम बुद्धिमत्ता (एआई) फर्म, इलेवनलैब्स ने अपने वॉयस डिज़ाइन फीचर के लिए एक एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) जारी किया, जिसने हाल ही में अपनी शुरुआत की है। घोषणा पिछले हफ्ते हुई, और इसके साथ ही, कंपनी ने एक्स टू वॉयस नामक एक ओपन-सोर्स प्रोजेक्ट भी पेश किया, जो उपयोगकर्ता के पोस्ट के आधार पर एक्स (जिसे पहले ट्विटर के नाम से जाना जाता था) प्रोफ़ाइल के लिए एक अद्वितीय आवाज उत्पन्न कर सकता है। यह सुविधा एक टेक्स्ट प्रॉम्प्ट भी दिखाती है जो प्रोफ़ाइल के विश्लेषण के आधार पर स्वतः उत्पन्न होता है।
एक ब्लॉग पोस्ट में, इलेवनलैब्स ने दो नए एआई टूल के बारे में विस्तार से बताया। पहला वॉयस डिज़ाइन टूल का एपीआई संस्करण है, जिसे हाल ही में पेश किया गया था। वॉयस डिज़ाइन कंपनी द्वारा विकसित एक नई क्षमता है जो टेक्स्ट प्रॉम्प्ट के आधार पर अद्वितीय एआई आवाज उत्पन्न कर सकती है। ये आवाज़ें उपयोगकर्ता द्वारा साझा किए गए विवरण पर आधारित हैं, जिसमें पिच, समय, वितरण गति, स्वर-शैली और बहुत कुछ शामिल है।
अब यह फीचर कंपनी के एपीआई के जरिए उपलब्ध कराया जा रहा है। इसका मतलब है कि डेवलपर्स इस क्षमता का उपयोग ऐप्स और सॉफ़्टवेयर बनाने के लिए कर सकते हैं। वॉयस डिज़ाइन या तो डेवलपर्स द्वारा अपने एआई पात्रों के लिए आवाज विकसित करने के लिए या उपयोगकर्ताओं को पेश किया जा सकता है ताकि वे अपने लिए नई आवाजें उत्पन्न कर सकें।
कंपनी ने दो एंडपॉइंट की पेशकश की है। पहले डेवलपर्स को टेक्स्ट प्रॉम्प्ट के आधार पर तीन अद्वितीय वॉयस पूर्वावलोकन उत्पन्न करने की अनुमति देता है। दूसरा उन्हें स्थानीय उपयोग के लिए वॉयस पूर्वावलोकन को अपनी लाइब्रेरी में सहेजने की अनुमति देता है। इलेवनलैब्स ने एपीआई की कीमत या एआई मॉडल की प्रति अनुरोध लागत पर प्रकाश नहीं डाला। एआई मॉडल के बारे में विवरण भी ज्ञात नहीं है।
दूसरा टूल कंपनी का ओपन-सोर्स प्रोजेक्ट है जिसे एक्स टू वॉयस नाम दिया गया है। यह यहां वेब क्लाइंट पर परीक्षण के लिए उपलब्ध सुविधा का विस्तार है। उपयोगकर्ता एक एक्स उपयोगकर्ता नाम जोड़ सकते हैं और एआई स्वचालित रूप से बायो और पोस्ट सहित प्रोफ़ाइल का विश्लेषण करेगा। एक बार विश्लेषण करने के बाद, यह विश्लेषण के आधार पर एक टेक्स्ट प्रॉम्प्ट उत्पन्न करता है।
प्रोफ़ाइल के लिए एक अद्वितीय आवाज उत्पन्न करने के लिए टेक्स्ट प्रॉम्प्ट को वॉयस डिज़ाइन में स्वचालित रूप से फीड किया जाता है। गैजेट्स 360 ने इस सुविधा का परीक्षण किया और पाया कि किसी प्रोफ़ाइल के लिए ध्वनि पूर्वावलोकन उत्पन्न करने में 30 सेकंड से एक मिनट तक का समय लगता है। कुल मिलाकर, तीन ध्वनि पूर्वावलोकन उत्पन्न होते हैं। एआई आवाज एक लाइन बोलती है जो प्रोफाइल के विश्लेषण पर भी आधारित है।
तीन वॉयस पूर्वावलोकन के साथ, पेज टेक्स्ट प्रॉम्प्ट भी प्रदर्शित करता है जिसका उपयोग एआई वॉयस उत्पन्न करने के लिए किया जाता है। हमने यह भी पाया कि यह फीचर उन उपयोगकर्ताओं की प्रोफ़ाइल तस्वीरों को एनिमेट करता है, जिन्होंने अपने चेहरे का क्लोज़ जोड़ा है और बोले गए शब्दों से मेल खाने के लिए होंठ और मुंह की हरकतों को सिंक करता है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्सफेसबुक, व्हाट्सएप, थ्रेड्स और गूगल न्यूज। गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल की सदस्यता लें। यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो इंस्टाग्राम और यूट्यूब पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
Realme GT 7 Pro स्नैपड्रैगन 8 एलीट SoC, 6,500mAh बैटरी के साथ लॉन्च: कीमत, स्पेसिफिकेशन