Meta NotebookLlama AI Podcast Generator Released as ‘Open Source Tool’ to Take on Google’s NotebookLM
मेटा ने रविवार को एक नया ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस (एआई) टूल जारी किया जो Google NotebookLM को टक्कर देगा। नोटबुकलामा नाम का यह टूल एक एआई-संचालित पॉडकास्ट जनरेटर है, जहां उपयोगकर्ता एक पीडीएफ फाइल अपलोड कर सकते हैं और टूल इसे दो एआई अक्षरों के साथ एक ऑडियो पॉडकास्ट में बदल देगा। पूरी प्रक्रिया को पूरा करने के लिए टूल तीन अलग-अलग लामा 3.1 एआई मॉडल का उपयोग करता है। Google के टूल की तरह, NotebookLlama का पॉडकास्ट भी दो AI होस्ट के बीच फ्री-फ्लोइंग तरीके से आगे-पीछे की बातचीत का अनुसरण करता है।
मेटा नोटबुकलामा एआई टूल टेक्स्ट के ब्लॉक से ऑडियो पॉडकास्ट उत्पन्न करने के लिए तीन बड़े भाषा मॉडल का उपयोग करता है। वर्तमान में, टूल केवल पीडीएफ फाइलों को इनपुट के रूप में स्वीकार करता है, इसलिए उपयोगकर्ताओं को उनके पास जो भी टेक्स्ट प्रारूप है उसे पीडीएफ में परिवर्तित करना होगा।
NotebookLlama सबसे पहले पीडीएफ फाइल को प्री-प्रोसेस करने और इसे ‘.txt’ फाइल में सेव करने के लिए Llama 3.2 1B इंस्ट्रक्शन मॉडल का उपयोग करता है। फिर लामा 3.1 70बी इंस्ट्रक्शन मॉडल का उपयोग स्रोत डेटासेट का उपयोग करके पॉडकास्ट ट्रांसक्रिप्ट लिखने के लिए किया जाता है। फिर प्रतिलेखन को एक पुनः लेखक का उपयोग करके नाटकीय रूप दिया जाता है जो लामा 3.1 8बी निर्देश मॉडल का उपयोग करता है। अंत में, टेक्स्ट-टू-स्पीच वर्कफ़्लो में ट्रांसक्रिप्शन जोड़ने के लिए एक कस्टम टूल का उपयोग किया जाता है। इसके लिए मेटा Parler TTS टूल का उपयोग कर रहा है। इच्छुक व्यक्ति यहां GitHub लिस्टिंग से पॉडकास्ट उत्पन्न करने के लिए आवश्यक सभी मॉडलों तक पहुंच सकते हैं।
हालाँकि, ऊपर उल्लिखित एआई मॉडल केवल डेवलपर्स की सिफारिशें हैं। उपयोगकर्ता प्रत्येक चरण के लिए छोटे मॉडल का उपयोग करना पसंद कर सकते हैं, हालाँकि, परिणाम भिन्न हो सकते हैं। मेटा ने इस बात पर प्रकाश डाला कि अनुशंसित सेटअप में AI सिस्टम को चलाने के लिए, उपयोगकर्ताओं को लगभग 140GB की कुल मेमोरी वाले GPU की आवश्यकता होगी।
एक एक्स (जिसे पहले ट्विटर के नाम से जाना जाता था) उपयोगकर्ता ने जेनरेट किए गए पॉडकास्ट का एक नमूना पोस्ट किया। इसके आधार पर, ऐसा प्रतीत होता है कि ऑडियो गुणवत्ता Google NotebookLM जितनी अच्छी नहीं है, और यह तीखी और रोबोटिक लगती है। इसके अलावा, ऐसे उदाहरण भी हैं जहां ऑडियो के कुछ हिस्से छूट जाते हैं और एआई होस्ट एक-दूसरे के ऊपर बोलने लगते हैं।
मेटा कुछ मुद्दों को स्वीकार करता है और एआई उत्पाद के अगले संस्करण में उन्हें सुधारने की योजना बना रहा है। कंपनी ने इस बात पर प्रकाश डाला, “टीटीएस मॉडल इस बात की सीमा है कि यह कितना स्वाभाविक लगेगा। इसे संभवतः बेहतर पाइपलाइन और किसी अधिक जानकार की मदद से बेहतर बनाया जा सकता है।”
तकनीकी दिग्गज स्क्रिप्ट लिखने के लिए दो अलग-अलग एलएलएम का उपयोग करने की भी योजना बना रहे हैं, जहां प्रत्येक मॉडल पॉडकास्ट ध्वनि को अधिक संवादी बनाने के लिए दूसरे पर बहस करेगा। यह डेवलपर्स की भविष्य की पाइपलाइन का भी हिस्सा है। इसके अतिरिक्त, कंपनी ट्रांसक्रिप्ट लिखने के साथ-साथ अधिक इनपुट और आउटपुट प्रारूपों के लिए समर्थन बढ़ाने के लिए लामा 405बी एआई मॉडल का भी परीक्षण कर रही है।
नवीनतम तकनीकी समाचारों और समीक्षाओं के लिए गैजेट्स 360 को फ़ॉलो करें एक्सफेसबुक, व्हाट्सएप, थ्रेड्स और गूगल न्यूज। गैजेट और तकनीक पर नवीनतम वीडियो के लिए, हमारे YouTube चैनल की सदस्यता लें। यदि आप शीर्ष प्रभावशाली व्यक्तियों के बारे में सब कुछ जानना चाहते हैं, तो इंस्टाग्राम और यूट्यूब पर हमारे इन-हाउस Who’sThat360 को फ़ॉलो करें।
iPhone SE 4 6.06-इंच LTPS OLED स्क्रीन, 3,279mAh बैटरी और Apple के इन-हाउस मॉडेम के साथ आने की उम्मीद है
इंडोनेशिया में iPhone 16 सीरीज की बिक्री निवेश आवश्यकताओं के पूरा न होने के कारण अवरुद्ध है