A.I

ElevenLabs Releases AI-Powered Voice Design API and X to Voice Features

0 3 2 minutes read

न्यूयॉर्क स्थित कृत्रिम बुद्धिमत्ता (एआई) फर्म, इलेवनलैब्स ने अपने वॉयस डिज़ाइन फीचर के लिए एक एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) जारी किया, जिसने हाल ही में अपनी शुरुआत की है। घोषणा पिछले हफ्ते हुई, और इसके साथ ही, कंपनी ने एक्स टू वॉयस नामक एक ओपन-सोर्स प्रोजेक्ट भी पेश किया, जो उपयोगकर्ता के पोस्ट के आधार पर एक्स (जिसे पहले ट्विटर के नाम से जाना जाता था) प्रोफ़ाइल के लिए एक अद्वितीय आवाज उत्पन्न कर सकता है। यह सुविधा एक टेक्स्ट प्रॉम्प्ट भी दिखाती है जो प्रोफ़ाइल के विश्लेषण के आधार पर स्वतः उत्पन्न होता है।

एक ब्लॉग पोस्ट में, इलेवनलैब्स ने दो नए एआई टूल के बारे में विस्तार से बताया। पहला वॉयस डिज़ाइन टूल का एपीआई संस्करण है, जिसे हाल ही में पेश किया गया था। वॉयस डिज़ाइन कंपनी द्वारा विकसित एक नई क्षमता है जो टेक्स्ट प्रॉम्प्ट के आधार पर अद्वितीय एआई आवाज उत्पन्न कर सकती है। ये आवाज़ें उपयोगकर्ता द्वारा साझा किए गए विवरण पर आधारित हैं, जिसमें पिच, समय, वितरण गति, स्वर-शैली और बहुत कुछ शामिल है।

अब यह फीचर कंपनी के एपीआई के जरिए उपलब्ध कराया जा रहा है। इसका मतलब है कि डेवलपर्स इस क्षमता का उपयोग ऐप्स और सॉफ़्टवेयर बनाने के लिए कर सकते हैं। वॉयस डिज़ाइन या तो डेवलपर्स द्वारा अपने एआई पात्रों के लिए आवाज विकसित करने के लिए या उपयोगकर्ताओं को पेश किया जा सकता है ताकि वे अपने लिए नई आवाजें उत्पन्न कर सकें।

कंपनी ने दो एंडपॉइंट की पेशकश की है। पहले डेवलपर्स को टेक्स्ट प्रॉम्प्ट के आधार पर तीन अद्वितीय वॉयस पूर्वावलोकन उत्पन्न करने की अनुमति देता है। दूसरा उन्हें स्थानीय उपयोग के लिए वॉयस पूर्वावलोकन को अपनी लाइब्रेरी में सहेजने की अनुमति देता है। इलेवनलैब्स ने एपीआई की कीमत या एआई मॉडल की प्रति अनुरोध लागत पर प्रकाश नहीं डाला। एआई मॉडल के बारे में विवरण भी ज्ञात नहीं है।

दूसरा टूल कंपनी का ओपन-सोर्स प्रोजेक्ट है जिसे एक्स टू वॉयस नाम दिया गया है। यह यहां वेब क्लाइंट पर परीक्षण के लिए उपलब्ध सुविधा का विस्तार है। उपयोगकर्ता एक एक्स उपयोगकर्ता नाम जोड़ सकते हैं और एआई स्वचालित रूप से बायो और पोस्ट सहित प्रोफ़ाइल का विश्लेषण करेगा। एक बार विश्लेषण करने के बाद, यह विश्लेषण के आधार पर एक टेक्स्ट प्रॉम्प्ट उत्पन्न करता है।

प्रोफ़ाइल के लिए एक अद्वितीय आवाज उत्पन्न करने के लिए टेक्स्ट प्रॉम्प्ट को वॉयस डिज़ाइन में स्वचालित रूप से फीड किया जाता है। गैजेट्स 360 ने इस सुविधा का परीक्षण किया और पाया कि किसी प्रोफ़ाइल के लिए ध्वनि पूर्वावलोकन उत्पन्न करने में 30 सेकंड से एक मिनट तक का समय लगता है। कुल मिलाकर, तीन ध्वनि पूर्वावलोकन उत्पन्न होते हैं। एआई आवाज एक लाइन बोलती है जो प्रोफाइल के विश्लेषण पर भी आधारित है।

तीन वॉयस पूर्वावलोकन के साथ, पेज टेक्स्ट प्रॉम्प्ट भी प्रदर्शित करता है जिसका उपयोग एआई वॉयस उत्पन्न करने के लिए किया जाता है। हमने यह भी पाया कि यह फीचर उन उपयोगकर्ताओं की प्रोफ़ाइल तस्वीरों को एनिमेट करता है, जिन्होंने अपने चेहरे का क्लोज़ जोड़ा है और बोले गए शब्दों से मेल खाने के लिए होंठ और मुंह की हरकतों को सिंक करता है।

नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्सफेसबुक, व्हाट्सएप, थ्रेड्स और गूगल न्यूज। गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल की सदस्यता लें। यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो इंस्टाग्राम और यूट्यूब पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।

Realme GT 7 Pro स्नैपड्रैगन 8 एलीट SoC, 6,500mAh बैटरी के साथ लॉन्च: कीमत, स्पेसिफिकेशन

Source link

Post Views: 10

Tags
इलेवनलैब्स एआई टूल वॉयस डिज़ाइन एपीआई ओपन सोर्स एक्स फीचर इलेवनलैब्स द्वारा जारी किया गया एक्स ऐ कृत्रिम होशियारी चहचहाना

Biplab Das Send an email 1 week ago
0 3 2 minutes read

Facebook Twitter LinkedIn Tumblr Pinterest Reddit VKontakte Odnoklassniki Pocket

Share
Facebook Twitter LinkedIn Tumblr Pinterest Reddit VKontakte Odnoklassniki Pocket Share via Email Print