Top AI Highlights of 2024: From OpenAI’s ChatGPT to Google’s Gemini and More
यदि 2023 जनरेटिव आर्टिफिशियल इंटेलिजेंस (एआई) के उदय और मुख्यधारा की तकनीकी बातचीत में इसके प्रवेश के बारे में था, तो 2024 वह वर्ष बन गया जब एआई ने अपनी परिवर्तनकारी क्षमताओं को प्रदर्शित करना शुरू किया। जो एक टेक्स्ट-आधारित चैटबॉट सनक के रूप में शुरू हुआ था जो उपयोगकर्ताओं को मानव की तरह प्रतिक्रिया दे सकता था, आज कई प्रमुख तकनीकी उत्पादों और प्लेटफार्मों को व्यावहारिक उपयोग के मामलों की पेशकश करने में सक्षम बना रहा है। प्रौद्योगिकी के नए उपयोग के मामले संगीत और वीडियो निर्माण के साथ-साथ एजेंटिक क्षमताओं में भी देखे गए। और नकारने वालों की राय के विपरीत, एआई बुलबुला इस साल नहीं फूटा।
वर्ष 2024 में उन्नत तर्क पर केंद्रित बड़े भाषा मॉडल (एलएलएम) का प्रवेश हुआ, एआई पीसी (यदि आप इसके लिए माइक्रोसॉफ्ट का शब्द लेते हैं तो कोपायलट + पीसी) के युग की शुरुआत हुई, और ओपन-सोर्स एआई स्पेस की त्वरित वृद्धि हुई। हालाँकि, ये कुछ प्रमुख घटनाएँ हैं जो इस वर्ष सुर्खियों में रहीं। आइए उन सर्वोत्तम और सबसे बड़े क्षणों पर एक नज़र डालें जिन्होंने 2024 में एआई क्षेत्र को आकार दिया।
OpenAI का उच्च-प्रदर्शन AI मॉडल का वर्ष
ओपनएआई ने 2022 के अंत में अपने जेनरेटिव प्री-ट्रेंड ट्रांसफार्मर (जीपीटी) आर्किटेक्चर के साथ जेनरेटिव एआई ट्रेंड शुरू किया होगा, लेकिन 2023 के अंत तक, यह स्पष्ट था कि तकनीकी दिग्गज लंबे समय तक दौड़ से बाहर नहीं रहने वाले थे। Google, Microsoft, Meta और यहां तक कि Amazon ने बेंचमार्क स्कोर में शीर्ष स्थान हासिल करने की कोशिश में कई AI मॉडल जारी किए।
ओपनएआई ने मई में अपने उन्नत तर्क-केंद्रित जीपीटी-4ओ एआई मॉडल रिलीज के साथ साल की बड़ी शुरुआत की, जिसके बाद जुलाई में जीपीटी-4ओ मिनी जारी किया गया। एआई फर्म ने ओ1 मॉडल के पूर्ण संस्करण के लॉन्च और अपने टेक्स्ट-टू-वीडियो मॉडल सोरा की बहुप्रतीक्षित रिलीज के साथ वर्ष का अंत उच्च स्तर पर किया।
इसके अतिरिक्त, कंपनी ने चैटजीपीटी ऐप में विज़न के साथ अपना एडवांस्ड वॉयस मोड भी पेश किया, जो चैटबॉट के साथ बातचीत करने के नए तरीके पेश करता है। OpenAI ने ChatGPT सर्च नामक अपना स्वयं का खोज इंजन भी लॉन्च किया, जिसे चैटबॉट प्लेटफ़ॉर्म के भीतर एकीकृत किया गया था।
लेकिन एआई फर्म के लिए सबसे बड़ा तख्तापलट ऐप्पल के साथ साझेदारी के रूप में हुआ, जिसमें चैटजीपीटी को ऐप्पल इंटेलिजेंस टूल के साथ एकीकृत किया गया। साझेदारी के बाद, OpenAI ने ChatGPT के लिए एक स्टैंडअलोन macOS और Windows ऐप भी जारी किया।
Google की AI पेशकशों का विविध सेट
Google भी बड़ी संख्या में मॉडल रिलीज़ के साथ आगे बढ़ा। फरवरी में, कंपनी ने एक ट्रिलियन मापदंडों के साथ जेमिनी 1.5 प्रो सहित एआई मॉडल की जेमिनी 1.5 श्रृंखला पेश की। दिसंबर में, इसने जेमिनी 2.0 श्रृंखला जारी करके वर्ष का समापन किया, जिसमें फ़्लैश मॉडल पूर्वावलोकन में सभी के लिए उपलब्ध था, और एक बड़ा मॉडल भुगतान किए गए ग्राहकों के लिए आरक्षित था।
लेकिन माउंटेन व्यू-आधारित तकनीकी दिग्गज ने इतना ही नहीं किया। कंपनी की AI विंग Google DeepMind ने Imagen 3 इमेज जेनरेशन मॉडल और Veo 2 वीडियो जेनरेशन मॉडल जारी किया है, और म्यूजिक जेनरेशन AI मॉडल MusicLM का पूर्वावलोकन किया है। इसके अलावा, टेक दिग्गज ने बड़े दस्तावेज़ों को संसाधित करने के लिए एक एआई टूल नोटबुकएलएम भी जारी किया, जो दो एआई होस्ट के साथ आकर्षक पॉडकास्ट भी बना सकता है।
कंपनी ने जेमिनी में नए फीचर्स भी पेश किए हैं। इसमें जेमिनी लाइव नामक दो-तरफ़ा ध्वनि संचार सुविधा जोड़ी गई, जेमिनी एआई असिस्टेंट को जीमेल, डॉक्स, स्लाइड्स और शीट्स सहित अधिकांश Google वर्कस्पेस ऐप्स में एकीकृत किया गया।
मेटा शायद 2024 से पहले अपने सोशल मीडिया प्लेटफॉर्म के लिए जाना जाता था, लेकिन इस साल, कंपनी ने कई छोटे भाषा मॉडल (एसएलएम) विकसित और जारी करके अपनी क्षमताओं का प्रदर्शन किया, जिनमें से कई खुले स्रोत में जारी किए गए थे।
तकनीकी दिग्गज ने अपने कई बड़े भाषा मॉडल मेटा एआई (लामा) श्रृंखला मॉडल पेश किए, जिनमें 70बी और 30बी कोडिंग-केंद्रित मॉडल, सबसे बड़ा ओपन-सोर्स मॉडल लामा 3.1 405बी, साथ ही कई निर्देश मॉडल शामिल हैं। हालाँकि, कंपनी की सबसे बड़ी घोषणा वैश्विक स्तर पर अपने मूल चैटबॉट मेटा एआई के विस्तार के साथ हुई।
मेटा एआई को फेसबुक के मैसेंजर, इंस्टाग्राम और व्हाट्सएप में जोड़ा गया था और सितंबर तक इसे वैश्विक स्तर पर उपलब्ध कराने से पहले अप्रैल 2024 में भारत सहित कई क्षेत्रों में विस्तारित किया गया था। वास्तविक समय दृष्टि प्रसंस्करण क्षमताओं के साथ इसके रे-बैन मेटा ग्लास में एआई-संचालित चैटबॉट भी जोड़ा गया था।
माइक्रोसॉफ्ट और कोपायलट+ पीसी का युग
ओपनएआई के एआई मॉडल का उपयोग करते हुए भी, माइक्रोसॉफ्ट पीसी क्षेत्र में एआई जगह बनाने में सफल रहा। रेडमंड-आधारित तकनीकी दिग्गज ने अपनी इच्छाओं को तुरंत प्रकट किया जब उसने एआई पीसी वर्गीकरण को पेश करने के लिए स्नैपड्रैगन (और बाद में इंटेल और एएमडी के साथ) के साथ साझेदारी की, जिसकी एक अनिवार्य आवश्यकता थी – कीबोर्ड पर एक भौतिक कोपायलट बटन को जोड़ना। इस प्रकार कोपायलट+ पीसी का युग आया, जहां कंपनी के मूल चैटबॉट को विंडोज ऑपरेटिंग सिस्टम के माध्यम से डेस्कटॉप और लैपटॉप में एकीकृत किया गया था।
अपने एआई चैटबॉट को लाखों उपयोगकर्ताओं तक विस्तारित करना हर बिजनेस प्लेबुक में एक सफलता माना जाएगा, हालांकि, तकनीकी दिग्गज अभी तक ऐसा नहीं कर पाए हैं। 2024 में, इसने Microsoft 365 उत्पादों में कोपायलट टूल को भी एकीकृत किया, और चैटबॉट में आवाज और दृष्टि क्षमता को जोड़ा। इसके अतिरिक्त, इसने एआई-पावर्ड रिकॉल फीचर (बीटा में) भी लॉन्च किया, जो पीसी उपयोगकर्ताओं को पिछले डिवाइस गतिविधि के बारे में एआई प्रश्न पूछने की सुविधा देता है।
एआई एग्रीगेटर के रूप में अमेज़ॅन की भूमिका
कई उद्योग विश्लेषकों ने कहा था कि अमेज़ॅन को एआई क्षेत्र में प्रवेश करने में देर हो गई है, और हालांकि यह सच हो सकता है, कंपनी ने एआई क्षेत्र में अभी भी प्रासंगिक बने रहने के लिए 2024 में एक अनूठा रास्ता अपनाया। एआई-आधारित रिलीज के मामले में, कंपनी के पास ज्यादा असाधारण क्षण नहीं थे। इसने अमेज़ॅन ऐप में रूफस एआई टूल जारी किया जो शॉपिंग सहायक के रूप में कार्य करता है। इसने एआई मॉडल की टाइटन श्रृंखला और उद्यमों के लिए एक वीडियो जेनरेशन मॉडल भी जारी किया।
हालाँकि, कंपनी ने भी चुपचाप एक एग्रीगेटर की भूमिका निभाई और बड़ी संख्या में तृतीय-पक्षों से AI मॉडल को अपने अमेज़ॅन वेब सर्विसेज (AWS) प्लेटफ़ॉर्म पर एकीकृत करना शुरू कर दिया। इसने एआई उपकरण जारी करने में भी निवेश किया जो प्रतिक्रियाओं की दक्षता में सुधार करता है और मतिभ्रम को कम करता है। अमेज़ॅन ने अपने सर्वरों को भी मजबूत किया ताकि वे बड़ी मात्रा में एआई प्रोसेसिंग को संभालने में सक्षम हो सकें।
अन्य उल्लेखनीय एआई घोषणाएँ
जबकि 2024 में सुर्खियों में प्रमुख एआई खिलाड़ी थे, छोटी एआई कंपनियां भी प्रभावित करने में विफल नहीं रहीं। एंथ्रोपिक ने क्लाउड के साथ अपनी सफलता जारी रखते हुए वर्ष की शुरुआत में क्लाउड 3 श्रृंखला और अंत में क्लाउड 3.5 श्रृंखला जारी की। कंपनी ने बीटा में मैक और विंडोज़ के लिए एक डेस्कटॉप ऐप, साथ ही एंड्रॉइड और आईओएस के लिए स्टैंडअलोन ऐप भी लॉन्च किया। इसके अतिरिक्त, इसके टूल उपयोग और पीडीएफ समझ क्षमताओं ने क्लाउड को 2024 में अधिक सक्षम चैटबॉट बना दिया।
एआई-संचालित खोज इंजन, पर्प्लेक्सिटी ने एक प्रो मोड लॉन्च किया है जो जटिल प्रश्नों के लिए विस्तृत प्रतिक्रियाएँ दिखाता है। इसने इस साल एक स्टैंडअलोन मैक ऐप भी लॉन्च किया। हालाँकि, सकारात्मक बातें होने के बावजूद, प्रीमियम ग्राहकों के लिए भी विज्ञापन शामिल करने के कंपनी के फैसले की कुछ आलोचना हुई।
मिस्ट्रल ने 2024 में भी पूरी तरह से ओपन-सोर्स एआई मॉडल की लगातार रिलीज जारी रखी। इसकी शुरुआत 8×22बी मिक्सचर ऑफ एक्सपर्ट्स (एमओई) एआई मॉडल की रिलीज के साथ हुई और इसके बाद मिक्सट्रल ओपन 2 एलएलएम आया। कंपनी ने पिक्सट्रल 12बी एआई मॉडल जारी करके डेवलपर्स को भी आश्चर्यचकित किया जो कंप्यूटर विज़न क्षमताओं के साथ आता है।
2025 में एआई: एक संक्षिप्त आउटलुक
हालाँकि हमने 2024 में एआई क्षेत्र में सभी प्रमुख घोषणाओं को पकड़ने की कोशिश की है, लेकिन तकनीकी उद्योग में तेजी से बढ़ रहे एआई बुखार को देखते हुए हर एक उल्लेखनीय रिलीज का उल्लेख करना काफी असंभव है। लेकिन अब जब वर्ष समाप्त हो रहा है, तो हम उम्मीद करते हैं कि 2025 इस तकनीक के लिए इसी तरह की कार्रवाई से भरपूर वर्ष होगा।
आने वाले वर्ष में, हम एजेंटिक एआई के बढ़ने और प्लेटफार्मों और उपकरणों में इसके एकीकरण को देखने की उम्मीद करते हैं। कल्पना करें कि आपके चैटबॉट से मूवी टिकट बुक करने या न्यूनतम संभव कीमत पर कोई उत्पाद खरीदने के लिए कहा जाए और वह बिना किसी हस्तक्षेप की आवश्यकता के कार्रवाई पूरी कर दे। एआई एजेंट यही पेशकश कर सकते हैं।
इसके अतिरिक्त, हम यह भी मानते हैं कि आगामी वर्ष में चैटबॉट्स में मेमोरी फ़ंक्शन का बेहतर कार्यान्वयन देखा जाएगा, जो अल्पविकसित पुनर्प्राप्ति-संवर्धित पीढ़ी (आरएजी) ढांचे को हटा देगा। इससे चैटबॉट उपयोगकर्ताओं के लिए बेहतर सहायक और साथी बन जाएंगे। आने वाले वर्ष में रीयल-टाइम वीडियो प्रोसेसिंग भी अधिक सुलभ हो सकती है। और अंत में, हमारा मानना है कि भारत 2025 में एआई को अपनाने की दिशा में बड़े कदम उठाएगा।