Anthropic Introduces Upgraded Claude 3.5 Sonnet AI Model With Capability to Complete Tasks on PCs
एंथ्रोपिक ने मंगलवार को दो नए कृत्रिम बुद्धिमत्ता (एआई) मॉडल और एक नई एआई क्षमता पेश की। सबसे बड़ा परिचय क्लाउड 3.5 सॉनेट का उन्नत संस्करण है जिसके बारे में दावा किया जाता है कि यह विभिन्न श्रेणियों में बेहतर बेंचमार्क स्कोर प्रदान करता है। नए 3.5 सॉनेट को कंप्यूटर यूज़ नामक एक नई क्षमता भी मिलती है, जो इसे कंप्यूटर को समझने और उसके साथ बातचीत करने की अनुमति देगी, अनिवार्य रूप से इसे पीसी पर कार्यों को नियंत्रित करने और पूरा करने की अनुमति देगी। इसके अलावा, एआई फर्म ने क्लाउड 3.5 हाइकु की भी घोषणा की, जो क्लाउड 3 हाइकु का उत्तराधिकारी है।
कंप्यूटर उपयोग के साथ उन्नत क्लाउड 3.5 सॉनेट पेश किया गया
एक न्यूज़ रूम पोस्ट में, एंथ्रोपिक ने एक उन्नत क्लाउड 3.5 सॉनेट की घोषणा की, जो जून में जारी एआई मॉडल की तुलना में बेहतर प्रदर्शन प्रदान करता है। एआई फर्म ने दावा किया कि नया मॉडल ग्रेजुएट-लेवल गूगल-प्रूफ क्यू एंड ए (जीपीक्यूए), मैसिव मल्टीटास्क लैंग्वेज अंडरस्टैंडिंग (एमएमएलयू) प्रो और कोडिंग-केंद्रित ह्यूमनएवल जैसे बेंचमार्क में चैटजीपीटी-4ओ और जेमिनी 1.5 प्रो से बेहतर प्रदर्शन करता है।
हालाँकि, दो विशेष बेंचमार्क में सबसे महत्वपूर्ण सुधार का दावा किया गया है – सॉफ्टवेयर इंजीनियरिंग बेंचमार्क (एसडब्ल्यूई-बेंच), जो 33.4 प्रतिशत से बढ़कर 49 प्रतिशत हो गया, और टूल-एजेंट-यूजर (टीएयू-बेंच), जो 62.6 प्रतिशत से बढ़कर हो गया। 69.2 प्रतिशत. ये दोनों बेंचमार्क एआई एजेंटिक प्रदर्शन से संबंधित हैं।
यह एआई एजेंटिक क्षमता प्रासंगिक है क्योंकि एंथ्रोपिक ने नई कंप्यूटर उपयोग क्षमता पेश की है जो एआई मॉडल को पीसी पर कार्यों को नियंत्रित करने और पूरा करने की अनुमति देती है। वर्तमान में, यह क्षमता एक एप्लिकेशन प्रोग्रामिंग इंटरफ़ेस (एपीआई) के माध्यम से उपलब्ध है जो केवल क्लाउड 3.5 सॉनेट पर चलती है।
कंप्यूटर के उपयोग के साथ, क्लाउड सामान्य कंप्यूटर कौशल सीख रहा है। विशेष सॉफ्टवेयर के साथ, यह कीस्ट्रोक्स, बटन क्लिक और कर्सर मूवमेंट की नकल कर सकता है। इसे एआई मॉडल की मौजूदा कंप्यूटर विज़न क्षमता में जोड़कर, क्लाउड 3.5 सॉनेट देख सकता है कि स्क्रीन पर क्या हो रहा है, और विशिष्ट कार्यों को पूरा करने के लिए जानकारी को संसाधित कर सकता है। यह सुविधा एआई को दिए गए संकेतों के आधार पर काम करेगी।
उदाहरण के लिए, उपयोगकर्ता बड़े भाषा मॉडल (एलएलएम) से किसी वेबसाइट पर टिकट बुक करने, एक एप्लिकेशन भरने या यहां तक कि एक एप्लिकेशन डाउनलोड और इंस्टॉल करने के लिए कह सकते हैं। जबकि विशेष उपकरण जो कुछ पीसी कार्यों को स्वचालित कर सकते हैं, पहले से ही मौजूद हैं, एक सामान्य-उद्देश्यीय उपकरण जो प्राकृतिक-भाषा संकेतों पर काम करता है, जेनरेटिव एआई तकनीक के लिए एक महत्वपूर्ण मील का पत्थर है।
हालाँकि, एंथ्रोपिक मानते हैं कि यह क्षमता अभी भी शुरुआती चरण में है और इसकी कुछ सीमाएँ हैं। कंपनी ने प्रकाश डाला, “कुछ कार्य जो लोग सहजता से करते हैं – स्क्रॉल करना, खींचना, ज़ूम करना – वर्तमान में क्लाउड के लिए चुनौतियाँ पेश करते हैं।” अभी के लिए, यह सलाह दी जाती है कि डेवलपर्स को इस क्षमता का उपयोग केवल कम जोखिम वाले कार्यों के लिए करना चाहिए।
स्वचालित कंप्यूटर नियंत्रण क्षमताओं के साथ, इस बात को लेकर चिंताएं हैं कि क्या एआई मॉडल को हानिकारक और अवैध गतिविधियों को करने के लिए इंजीनियर किया जा सकता है। कंपनी ने फिलहाल एआई मॉडल की सुरक्षा और यूजर्स की सुरक्षा के बारे में कोई जानकारी नहीं दी है। विशेष रूप से, उन्नत क्लाउड 3.5 सॉनेट सभी उपयोगकर्ताओं के लिए उपलब्ध है और डेवलपर्स एंथ्रोपिक एपीआई, अमेज़ॅन बेडरॉक और Google क्लाउड के वर्टेक्स एआई के माध्यम से इस क्षमता का निर्माण कर सकते हैं।
क्लाउड 3.5 हाइकु की घोषणा की गई
एक और बड़ी घोषणा क्लाउड 3.5 हाइकु का अनावरण थी। संदर्भ के लिए, हाइकू एंथ्रोपिक द्वारा पेश की गई सबसे सस्ती और सबसे तेज़ एआई मॉडल श्रृंखला है। एआई फर्म अब दावा करती है कि क्लाउड 3 हाइकु के उत्तराधिकारी की क्षमताएं कंपनी के पिछले फ्लैगशिप-ग्रेड मॉडल क्लाउड 3 ओपस से बेहतर प्रदर्शन करती हैं। इसका मतलब है कि उपयोगकर्ता अब बहुत सस्ती कीमत पर एक शक्तिशाली एआई मॉडल तक पहुंच सकते हैं।
क्लाउड 3.5 हाइकु इस महीने के अंत में कंपनी के एपीआई, अमेज़ॅन बेडरॉक और Google क्लाउड के वर्टेक्स एआई सहित विभिन्न प्लेटफार्मों पर जारी किया जाएगा। यह शुरुआत में केवल टेक्स्ट मॉडल के रूप में उपलब्ध होगा और बाद में छवियों को इनपुट के रूप में स्वीकार करने के लिए अपडेट किया जाएगा।