A.I

Hume Introduces Interpretability-Based Voice Control Feature for AI Voice Customisation

न्यूयॉर्क स्थित कृत्रिम बुद्धिमत्ता (एआई) फर्म ह्यूम ने सोमवार को एक नए टूल का अनावरण किया जो उपयोगकर्ताओं को एआई आवाजों को अनुकूलित करने की अनुमति देगा। डब्ड वॉयस कंट्रोल, नई सुविधा का उद्देश्य डेवलपर्स को इन आवाजों को उनके चैटबॉट और अन्य एआई-आधारित अनुप्रयोगों में एकीकृत करने में मदद करना है। आवाज़ों की एक बड़ी श्रृंखला की पेशकश करने के बजाय, कंपनी आवाज़ों के 10 विभिन्न आयामों पर विस्तृत नियंत्रण प्रदान करती है। प्रत्येक आयाम में वांछित पैरामीटर का चयन करके, उपयोगकर्ता अपने ऐप्स के लिए अद्वितीय आवाज़ें उत्पन्न कर सकते हैं।

कंपनी ने एक ब्लॉग पोस्ट में नए AI टूल के बारे में विस्तार से बताया। ह्यूम ने कहा कि वह अपने ब्रांड की पहचान से मेल खाने के लिए सही एआई आवाज ढूंढने वाले उद्यमों की समस्या को हल करने की कोशिश कर रहा है। इस सुविधा के साथ, उपयोगकर्ता आवाज की धारणा के विभिन्न पहलुओं को अनुकूलित कर सकते हैं और डेवलपर्स को एआई-आधारित अनुप्रयोगों के लिए अधिक मुखर, आरामदायक या उत्साही आवाज बनाने की अनुमति दे सकते हैं।

ह्यूम का वॉयस कंट्रोल फिलहाल बीटा में उपलब्ध है, लेकिन इसे प्लेटफॉर्म पर पंजीकृत कोई भी व्यक्ति एक्सेस कर सकता है। गैजेट्स 360 स्टाफ सदस्य टूल तक पहुंचने और फीचर का परीक्षण करने में सक्षम थे। 10 अलग-अलग आयाम हैं जिन्हें डेवलपर्स समायोजित कर सकते हैं जिनमें लिंग, दृढ़ता, उछाल, आत्मविश्वास, उत्साह, नासिकाता, आराम, सहजता, तीखापन और जकड़न शामिल हैं।

प्रॉम्प्ट-आधारित अनुकूलन जोड़ने के बजाय, कंपनी ने एक स्लाइडर जोड़ा है जो प्रत्येक मेट्रिक्स के लिए -100 से +100 तक जाता है। कंपनी ने कहा कि यह दृष्टिकोण किसी आवाज के पाठ्य विवरण से जुड़ी अस्पष्टता को खत्म करने और भाषाओं पर विस्तृत नियंत्रण प्रदान करने के लिए उठाया गया था।

हमारे परीक्षण में, हमने पाया कि दस आयामों में से किसी एक को बदलने से एआई आवाज में एक श्रव्य अंतर आता है और उपकरण विभिन्न आयामों को सही ढंग से सुलझाने में सक्षम था। एआई फर्म ने दावा किया कि यह एक नया “अपर्यवेक्षित दृष्टिकोण” विकसित करके हासिल किया गया था जो विशिष्ट मापदंडों के भिन्न होने पर प्रत्येक आधार आवाज की अधिकांश विशेषताओं को संरक्षित करता है। विशेष रूप से, ह्यूम ने खरीदे गए डेटा के स्रोत का विवरण नहीं दिया।

विशेष रूप से, एआई वॉयस बनाने के बाद, डेवलपर्स को इसके एम्पैथिक वॉयस इंटरफेस (ईवीआई) एआई मॉडल को कॉन्फ़िगर करके इसे एप्लिकेशन पर तैनात करना होगा। हालाँकि कंपनी ने निर्दिष्ट नहीं किया है, इस प्रायोगिक सुविधा के लिए EVI-2 मॉडल का उपयोग किए जाने की संभावना है।

भविष्य में, ह्यूम ने आधार आवाज़ों की सीमा का विस्तार करने, अतिरिक्त व्याख्या योग्य आयाम पेश करने, अत्यधिक संशोधनों के तहत आवाज विशेषताओं के संरक्षण को बढ़ाने और आवाज विशेषताओं का विश्लेषण और कल्पना करने के लिए उन्नत उपकरण विकसित करने की योजना बनाई है।

Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button