November 22, 2024
A.I

Beatoven.ai, an Indian AI Music Generation Platform, Is Making Music Creation Accessible

  • August 18, 2024
  • 1 min read
Beatoven.ai, an Indian AI Music Generation Platform, Is Making Music Creation Accessible

प्रौद्योगिकी हमेशा से ही एक महान समतलक रही है। औद्योगिक युग से लेकर इंटरनेट के युग तक, इसने आम लोगों के जीवन की गुणवत्ता में सुधार किया है और पहले अकल्पनीय चीजों को और अधिक सुलभ बना दिया है। किसी को केवल अपने स्मार्टफोन पर नज़र डालने की ज़रूरत है, यह समझने के लिए कि कैसे हज़ारों किलोमीटर दूर बैठे किसी व्यक्ति से संवाद करना इतना आम हो गया है कि ज़्यादातर लोग इसके बारे में ज़्यादा सोचते भी नहीं हैं। ग्राहम बेल से पहले, इस तरह की लंबी दूरी की संचार सुविधा केवल अमीर और प्रभावशाली लोगों के लिए ही उपलब्ध थी, क्योंकि इसके साथ बहुत ज़्यादा लागत जुड़ी हुई थी।

ऐसे अनगिनत उदाहरण हैं। सोशल मीडिया से लेकर दुनिया भर में सच्ची कनेक्टिविटी प्रदान करना, स्मार्टफ़ोन ऐप से ऐसे कार्यों को डिजिटल बनाना, जिनके लिए शारीरिक उपस्थिति की आवश्यकता होती थी और दिन के कई घंटे लगते थे, और दूर से काम करना जो कॉर्पोरेट हब से दूर रहने वाले लोगों को बेहतर कमाई के अवसर प्रदान करता है, तकनीक ने खुद ही पहुंच को लोकतांत्रिक बना दिया है। कई मायनों में, जनरेटिव आर्टिफिशियल इंटेलिजेंस (AI) नई सीमाओं तक पहुंच का विस्तार करने वाला अगला मशाल वाहक बन गया है।

ऐसा ही एक क्षेत्र है जहाँ पहुँच बहुत बड़ा प्रभाव डाल सकती है, वह है संगीत उद्योग। Spotify, SoundCloud, Apple Music और अन्य जैसे स्वतंत्र स्ट्रीमिंग प्लेटफ़ॉर्म के आने के बावजूद, संगीत वितरण को सस्ता बनाने के बावजूद, समस्या यह है कि संगीत निर्माण ही सबसे बड़ी समस्या है। आज, मूल पृष्ठभूमि संगीत एक बहुत ज़रूरी वस्तु है। पेशेवर कलाकारों से लेकर सोशल मीडिया क्रिएटर और पॉडकास्टर तक, सभी को अपनी सामग्री के लिए संगीत ट्रैक की आवश्यकता होती है, अधिमानतः मूल, प्लेटफ़ॉर्म द्वारा किसी भी कॉपीराइट स्ट्राइक (YouTube सामग्री निर्माता इसके प्रभाव से अच्छी तरह वाकिफ़ हैं) या मुकदमे से बचने के लिए।

लेकिन संगीत बनाना हर किसी के बस की बात नहीं है। संभवतः, यदि आपने एक या कई संगीत वाद्ययंत्रों में महारत हासिल करने के लिए वर्षों तक प्रशिक्षण नहीं लिया है, फिर भी आप अपनी व्यावसायिक आवश्यकताओं के लिए मूल और अद्वितीय संगीत चाहते हैं, तो आप खुद को केवल दो महंगे समाधानों के साथ फंसते हुए पाते हैं – एक संगीत निर्माता या सत्र संगीतकार को काम पर रखें, या ऑनलाइन भुगतान करके स्टॉक संगीत खरीदें। लेकिन अब ऐसा नहीं है, क्योंकि यहीं पर AI ने कदम रखा है।

Beatoven.ai का उदाहरण लें, जो एक भारतीय AI-संचालित संगीत निर्माण प्लेटफ़ॉर्म है जो उपयोगकर्ताओं को दस सेकंड के भीतर नया और अनूठा बैकग्राउंड संगीत बनाने के लिए एक सरल टेक्स्ट प्रॉम्प्ट लिखने देता है। यह समझने के लिए कि यह तकनीक कैसे काम करती है, इसके विभिन्न निहितार्थ और इस तरह के एक अभिनव स्टार्टअप को चलाने का अनुभव, हमने Gadgets 360 पर Beatoven.ai के सह-संस्थापक और सीईओ मंसूर रहीमत खान से बात की।

Beatoven.ai की शुरुआत और यात्रा

मंसूर रहिमत खान मंसूर रहिमत खान

गैजेट्स 360 अवार्ड्स में Beatoven.ai के सीईओ और सह-संस्थापक मंसूर रहीमत खान

मंसूर रहीमत खान ग्वालियर-इंदौर-धारवाड़ सितार घराने से आते हैं, जो संगीतकारों का एक प्रसिद्ध परिवार है जिसने सात पीढ़ियों से आधुनिक सितार संगीत बजाया और उसे आकार दिया है। खान भी इससे अलग नहीं थे, लेकिन उन्होंने अपने दूसरे जुनून – तकनीक के कारण एक अलग रास्ता चुना। खान ने हमें बताया, “मैंने इलेक्ट्रॉनिक्स और संचार इंजीनियरिंग में राष्ट्रीय प्रौद्योगिकी संस्थान (एनआईटी), गोवा से स्नातक की पढ़ाई पूरी की। यह वह समय था जब मैंने संगीत और प्रौद्योगिकी के चौराहे पर स्थित क्षेत्र में गहराई से जाना शुरू किया।”

कुछ सालों तक काम करने के बाद खान की मुलाकात सिद्धार्थ भारद्वाज से हुई, जो भारतीय प्रौद्योगिकी संस्थान (IIT), इलाहाबाद (जिसे अब प्रयागराज के नाम से जाना जाता है) के पूर्व छात्र हैं और संगीत के शौकीन हैं। दोनों की रुचियां एक जैसी थीं, उन्होंने कंटेंट में संगीत लाइसेंसिंग की समस्या को पहचाना और कुछ ऐसा बनाना चाहते थे जिससे संगीत लाखों क्रिएटर्स के लिए सुलभ हो सके – चाहे वह सोशल मीडिया पर हो या पेशेवर रूप से करियर बना रहे हों। यहीं से Beatoven.ai की शुरुआत हुई।

लेकिन एक समस्या थी। 2021 में जब दोनों ने उत्पाद और स्टार्टअप पर काम करना शुरू किया, तो समस्या के समाधान के लिए जनरेटिव AI की आवश्यकता थी, जो मुख्यधारा में आने में अभी भी एक साल दूर था (नवंबर 2022 में, ChatGPT ने यकीनन जनरेशन AI की दौड़ शुरू की)।

खान ने कहा, “शुरुआत में, 2021 में हमने जो प्रोटोटाइप बनाया था, वह एक बहुत ही साधारण प्लेटफ़ॉर्म था। उपयोगकर्ता एक शैली और एक टेम्पो चुन सकते थे और एक अवधि निर्दिष्ट कर सकते थे, और हम संगीत का एक मूल टुकड़ा तैयार कर सकते थे। उस समय, कोई बड़े भाषा मॉडल (LLM) मौजूद नहीं थे, इसलिए हमें अपना पूरा टेक स्टैक स्क्रैच से बनाना पड़ा। आज, हमारे पास अपनी खुद की मालिकाना तकनीक है जिसे हमने तब बनाना शुरू किया था।”

एआई लहर आने के बाद चीजें आसान हो गईं, और Beatoven.ai को बाजार में एलएलएम की उपलब्धता से लाभ हुआ, जिसका उपयोग करके वे अपने प्लेटफॉर्म को एक मिलियन के वर्तमान उपयोगकर्ता आधार की जरूरतों को पूरा करने के लिए बेहतर ढंग से सुसज्जित कर सके।

Beatoven.ai प्लेटफॉर्म

वेब-ओनली प्लेटफ़ॉर्म कंटेंट क्रिएटर्स के लिए एक जनरेटिव AI-पावर्ड म्यूज़िक जेनरेशन टूल है। उपयोगकर्ता, साइन अप करने के बाद, मूल बैकग्राउंड म्यूज़िक बनाने के लिए टेक्स्ट प्रॉम्प्ट लिख सकते हैं। वैकल्पिक रूप से, प्लेटफ़ॉर्म उपयोगकर्ताओं को संगीत बनाने के लिए टेम्पो, अवधि, शैली और मूड चुनने की भी अनुमति देता है।

एक बार जब उपयोगकर्ता इनपुट जोड़ देता है, तो AI कार्यभार संभाल लेता है और चार अलग-अलग ट्रैक बनाता है। प्लेटफ़ॉर्म पोस्ट-जनरेशन एडिटिंग सुविधाएँ भी प्रदान करता है जहाँ उपयोगकर्ता किसी इंस्ट्रूमेंट को बदल सकते हैं, विशिष्ट भागों में वॉल्यूम कम या ज़्यादा कर सकते हैं, या ट्रैक के पूरे हिस्से को फिर से बना सकते हैं। खान ने कहा कि एक सिंगल ट्रैक 15 मिनट तक लंबा हो सकता है, हालाँकि इसकी कोई ऊपरी सीमा नहीं है, और सुझाया गया मान रेंडरिंग समय को कम रखने के लिए मौजूद है। 1-2 मिनट की औसत लंबाई वाले ट्रैक को बनाने में लगभग 10 सेकंड का समय लगेगा। कंपनी द्वारा साझा किए गए डेटा के आधार पर, शुरुआत से ही, Beatoven ने 15 लाख साउंडट्रैक बनाए हैं और 3 लाख डाउनलोड किए हैं।

प्लेटफॉर्म वर्तमान में उपयोगकर्ताओं को फ्यूजन ट्रैक बनाने की अनुमति नहीं देता है जहां दो या अधिक शैलियों को मिश्रित किया जाता है, लेकिन खान ने गैजेट्स 360 को विशेष रूप से बताया कि कंपनी जल्द ही एक नया अपडेट जारी करेगी जिसमें यह सुविधा शामिल होगी।

हमने प्लेटफ़ॉर्म का परीक्षण भी किया और पाया कि संगीत काफी यथार्थवादी है। निम्नलिखित गीत “एक हाई-एनर्जी ईडीएम एंथम बनाएं जिसमें बीट ड्रॉप हो जो डांस पार्टी के लिए एकदम सही हो” प्रॉम्प्ट का उपयोग करके बनाया गया था।

Beatoven.ai टेक-स्टैक

बीटोवेन प्लेटफ़ॉर्म के दो घटक हैं। पहला है LLM, जो उपयोगकर्ताओं को प्राकृतिक भाषा में संकेत टाइप करने और फिर उस जानकारी को ऐसे प्रारूप में संसाधित करने की अनुमति देता है जिसे AI समझ सकता है और उसे संगीत में परिवर्तित कर सकता है। स्टार्टअप इस भाग के लिए GPT मॉडल का उपयोग करता है।

दूसरा घटक उपयोगकर्ता के इरादे को समझता है और एक ट्रैक बनाता है जो पैरामीटर को पूरा करता है। यह आर्किटेक्चर कंपनी द्वारा मूल रूप से बनाया गया था। AI मॉडल इसे संभव बनाने के लिए कंट्रास्टिव लर्निंग आर्किटेक्चर का उपयोग करता है। खान ने बताया कि इस तकनीक की प्रेरणा OpenAI के CLIP मॉडल से मिली, लेकिन जल्दी से बताते हैं कि OpenAI मॉडल को टेक्स्ट और इमेज के लिए बनाया गया था, और Beatoven ने इसे ध्वनि और संगीत के लिए इस्तेमाल करने वाली पहली कंपनी थी। यह एक मालिकाना काम होने के कारण, कंपनी इस प्रक्रिया को अनुकूलित करने में भी सक्षम थी। उदाहरण के लिए, खान ने हमें बताया कि प्लेटफ़ॉर्म GPU इंफ़रेंस के बजाय CPU इंफ़रेंस का उपयोग करता है। यह उल्लेखनीय है कि छोटे LLM को भी चलने के लिए GPU इंफ़रेंस की आवश्यकता होती है।

स्टार्टअप ने AI मॉडल को प्रशिक्षित करने के लिए स्वतंत्र कलाकारों से लगभग 1,00,000 डेटा नमूने प्राप्त किए हैं। कंपनी ने वैश्विक स्तर पर लगभग 250 कलाकारों के साथ सहयोग किया और उन्हें विशेष ट्रैक के लिए भुगतान किया। खान ने दावा किया कि कंपनी ने अपने सभी प्रशिक्षण डेटा को नैतिक रूप से प्राप्त किया था और इसके लिए इंटरनेट की खोज नहीं की थी। दिलचस्प बात यह है कि एडोब कथित तौर पर वर्तमान में AI वीडियो जनरेशन मॉडल बनाने के लिए ऐसा ही कर रहा है।

हालाँकि, आज डेटा एक अविश्वसनीय रूप से महंगा संसाधन बन गया है जिसकी लगातार AI मॉडल को अपग्रेड करने और उन्हें बेहतर बनाने के लिए आवश्यकता होती है। जबकि बीटोवेन आज भी कलाकारों के साथ मिलकर डेटा प्राप्त करने का अपना अभ्यास जारी रखता है, भविष्य में, यह एक राजस्व-साझाकरण मॉडल शुरू करके लागत में कटौती करने की योजना बना रहा है, जहाँ कलाकारों को उन ट्रैक की संख्या के आधार पर भुगतान किया जाएगा जहाँ AI ने गाने के नमूने या डेटा का उपयोग किया है।

Beatoven.ai प्रतिस्पर्धा से निपटने की योजना कैसे बना रहा है

आज के समय में AI आधारित संगीत निर्माण पूरी तरह से एक अनूठा प्रस्ताव नहीं है। कई खिलाड़ियों ने इस क्षेत्र में प्रवेश किया है, और इसकी क्षमता को पहचाना है। इनमें Google का MusicLM, OpenAI का Jukebox और Adobe का Project Music GenAI Control शामिल हैं। हालाँकि, इनमें से कोई भी मॉडल आज आम लोगों के लिए उपलब्ध नहीं है, और वे अभी भी विकास के अधीन हैं। लेकिन Beatoven के लिए प्रतिस्पर्धा अभी भी मौजूद है। उनके लिए एक बड़ा प्रतिद्वंद्वी Suno AI होगा, जो न केवल संगीत बनाता है बल्कि एक पूर्ण विकसित गीत पेश करने के लिए संगीत में AI-जनरेटेड आवाज़ें भी जोड़ता है।

चिंता के जवाब में, खान ने बताया कि कंपनी बिना किसी दर सीमा के असीमित संगीत उत्पादन की पेशकश करती है। इसके अलावा, उन्होंने बताया कि कंपनी एक संपूर्ण पारिस्थितिकी तंत्र का निर्माण कर रही है। एक तरफ, यह संगीत बनाकर उपयोगकर्ताओं की सेवा कर रही है, वहीं दूसरी तरफ, यह कलाकारों को अपना मूल संगीत बेचने के लिए एक जगह भी प्रदान करती है। खान का मानना ​​है कि पेशकशों का पूरा सेट, “नैतिक रूप से सोर्स किए गए और कॉपीराइट-मुक्त अद्वितीय संगीत” के वादे के साथ, बीटओवन को बाजार में बढ़त देता है।

भविष्य की ओर एक नज़र

बीटओवेन अब वैश्विक उपयोगकर्ता आधार को पूरा करने के लिए अपने प्लेटफ़ॉर्म का विस्तार करने पर विचार कर रहा है। स्टार्टअप ने पहले ही दुनिया के विभिन्न हिस्सों से कलाकारों को शामिल करना शुरू कर दिया है क्योंकि इसके 70 प्रतिशत उपयोगकर्ता देश के बाहर रहते हैं। खान का मानना ​​है कि यह वैश्विक दृष्टिकोण, AI मॉडल को बेहतर बनाने पर ध्यान केंद्रित करने के साथ-साथ अगले दो वर्षों में पाँच मिलियन उपयोगकर्ताओं के अपने लक्ष्य को प्राप्त करने की कुंजी होगी।

तकनीक अक्सर दोधारी तलवार साबित हो सकती है। जबकि AI द्वारा जनरेट किए गए संगीत के लाभों को कम करके नहीं आंका जा सकता है, लेकिन सवाल यह उठता है कि क्या इस तरह के आसान और किफ़ायती संगीत निर्माण का महत्वाकांक्षी संगीतकारों पर प्रतिकूल प्रभाव पड़ सकता है। क्या संगीत का वस्तुकरण वास्तव में सही रास्ता है?

खान का मानना ​​है कि संगीत निर्माण उद्योग में अगला बड़ा बदलाव बनने जा रहा है, लेकिन इससे संगीतकारों और गायकों के सपने और आजीविका छिनने की संभावना नहीं है। उन्होंने कहा, “मेरा मानना ​​है कि कलाकार अभी भी इस बदलाव के केंद्र में रहेंगे क्योंकि एआई मानवीय रचनात्मकता का मुकाबला नहीं कर सकता है।”


संबद्ध लिंक स्वचालित रूप से उत्पन्न हो सकते हैं – विवरण के लिए हमारा नैतिकता वक्तव्य देखें।

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *