Homeअंदरखानेसेरेब्रस सिस्टम्स ने प्राकृतिक भाषा प्रसंस्करण मॉडल में शुद्धता बेहतर करने के...

सेरेब्रस सिस्टम्स ने प्राकृतिक भाषा प्रसंस्करण मॉडल में शुद्धता बेहतर करने के लिए जीपीयू-इंपासिबल (GPU-Impossible™) लंबी अनुक्रम लंबाई को सक्षम किया

spot_img

Business Wire Indiaकृत्रिम बुद्धिमत्ता (एआई) कंप्यूट को गति देने में अग्रणी सेरेब्रस सिस्टम्स (Cerebras Systems) ने आज एक और उद्योग-पहली क्षमता जारी की। ग्राहक अब पारंपरिक कंप्यूटर हार्डवेयर की तुलना में 20x लंबे अनुक्रमों के साथ ट्रांसफार्मर-शैली के प्राकृतिक भाषा एआई मॉडल को तेजी से प्रशिक्षित कर सकते हैं। इस नई क्षमता से प्राकृतिक भाषा प्रसंस्करण (एनएलपी) में नई जानकारी और सफलता मिलने की उम्मीद है। किसी दिए गए शब्द, वाक्यांश या डीएनए के स्ट्रैंड की समझ के लिए बहुत अधिक संदर्भ प्रदान करके, लंबी अनुक्रम लंबाई क्षमता एनएलपी मॉडल को बहुत बेहतर समझ और बेहतर व शुद्ध भविष्यवाणी करने में सक्षम बनाती है।
 
इस प्रेस विज्ञप्ति में मल्टीमीडिया है। पूरी विज्ञप्ति यहां देखें: https://www.businesswire.com/news/home/20220831005105/en/
 
सेरेब्रस सिस्टम्स के सीईओ और सह-संस्थापक एंड्रयू फेल्डमैन ने कहा, ” इस साल की शुरुआत में, सेरेब्रस सीएस -2 ने एक डिवाइस पर 20 अरब पैरामीटर तक के सबसे बड़े प्राकृतिक भाषा प्रसंस्करण (एनएलपी) मॉडल (training the largest natural language processing (NLP) models) को प्रशिक्षित करने का रिकॉर्ड बनाया।” उन्होंने आगे कहा, “अब हम अपने ग्राहकों को सबसे बड़े एनएलपी मॉडल पर लंबे अनुक्रमों के साथ प्रशिक्षित करने में सक्षम बना रहे हैं। अब यह ऐसी शुद्धता देता है जो पूर्व में अप्राप्य था। इस तरह, एआई और गहन शिक्षण में नवाचार और संभावनाओं की एक नई दुनिया सामने आ गई है।”
 
भाषा संदर्भ के लिहाज से खास है। यही कारण है कि शब्दकोश से शब्द दर शब्द का अनुवाद नहीं किया जा सकता है—संदर्भ के बिना, शब्दों का अर्थ अक्सर अस्पष्ट होता है। भाषा में, एक शब्द को आसपास के शब्दों के संदर्भ में सबसे अच्छी तरह समझा जाता है, जो अर्थ को समझने के लिए मार्गदर्शक प्रदान करता है। एआई के मामले में भी ऐसा ही होता है। लंबी अनुक्रम लंबाई एक एनएलपी मॉडल को किसी दिए गए शब्द को एक बड़े और व्यापक संदर्भ में समझने में सक्षम बनाती है।
 
बिना संदर्भ के “टू बी और नॉट टू बी” अभिव्यक्ति सुनने की कल्पना करें और बस एक शब्दकोश का उपयोग करें। और फिर इसे हैमलेट के अभिनय II, दृश्य 1 के संदर्भ में समझने की कल्पना करें। और फिर कल्पना करें कि क्या आपके पास व्यापक संदर्भ था और इसे पूरे नाटक के संदर्भ में – या इससे भी बेहतर, तमाम शेक्सपियर साहित्य के संदर्भ में समझ सकते हैं। जिस संदर्भ में समझ होती है, वह व्यापक होती है, इसलिए समझ की शुद्धता भी विस्तृत होती है। चूंकि जिस संदर्भ के तहत चीजों को समझा जाता है उसका विस्तार होता है उसी तरह समझने की शुद्धता भी बेहतर होती है। संदर्भ को व्यापक रूप से विस्तारित करके (शब्दों का क्रम जिसके भीतर लक्षित शब्द समझा जाता है), सेरेब्रस एनएलपी मॉडल को भाषा की अधिक परिष्कृत समझ प्रदर्शित करने में सक्षम बनाता है। बड़ा और अधिक परिष्कृत संदर्भ एआई में समझ की सटीकता में सुधार करता है।
 
जहां कई उद्योगों को इस नई क्षमता से लाभ होगा, वहीं सेरेब्रस के फार्मास्युटिकल और जीवन विज्ञान के ग्राहक दवा खोजने के अपने प्रयासों के प्रभाव के बारे में विशेष रूप से उत्साहित हैं। डीएनए जीवन की भाषा है, और डीएनए का विश्लेषण बड़े भाषा मॉडल का विशेष रूप से शक्तिशाली अनुप्रयोग रहा है।
 
जीएसके में एआई और मशीन लर्निंग के वरिष्ठ उपाध्यक्ष और वैश्विक प्रमुख किम ब्रैनसन ने कहा, “जीएसके में मशीन लर्निंग में बड़े पैमाने पर उत्पन्न जटिल डेटासेट लेना और बहुत ही चुनौतीपूर्ण जैविक सवालों का जवाब देना शामिल है।” उन्होंने आगे कहा, “लंबी अनुक्रम लंबाई क्षमता हमें आस-पास के हजारों जीन के संदर्भ में एक विशेष जीन की जांच करने में सक्षम बनाती है। हम जानते हैं कि आस-पास के जीन का जीन अभिव्यक्ति पर प्रभाव पड़ता है, लेकिन हम इससे पहले एआई के भीतर इसका पता लगाने में सक्षम नहीं हैं।”
 
एनएलपी के प्रसार को बीईआरटी और जीपीटी जैसे ट्रांसफार्मर-शैली के नेटवर्क के असाधारण प्रदर्शन से प्रेरित किया गया है। हालाँकि, ये मॉडल कम्प्यूटेशनल लिहाज से बेहद गहन हैं। यहां तक कि जब ग्राफिक्स प्रोसेसिंग यूनिट (जीपीयू) के बड़े समूहों पर प्रशिक्षित किया जाता है, तो आज ये मॉडल केवल 2,500 टोकन की लंबाई तक अनुक्रमों को संसाधित कर सकते हैं। टोकन किसी दस्तावेज़ में शब्द, प्रोटीन में अमीनो एसिड, या गुणसूत्र पर आधार जोड़े हो सकते हैं। लेकिन आठ-पृष्ठ का दस्तावेज़ आसानी से 8,000 शब्दों से अधिक हो सकता है, जिसका अर्थ है कि एक लंबे दस्तावेज़ को संक्षेप में प्रस्तुत करने का प्रयास करने वाले एआई मॉडल में विषय वस्तु की समझ की कमी होगी। अनूठे सेरेब्रस वेफर-स्केल आर्किटेक्चर इस मूलभूत सीमा को पार कर जाता है और अनुक्रमों को लंबाई में पहले से असंभव 50,000 टोकन तक सक्षम बनाता है।
 
यह नवीनता पूर्व की अनछुई सीमा को खोल देती है। पारंपरिक भाषा प्रसंस्करण के भीतर भी, ऐसे कार्यों के कई उदाहरण हैं जिनमें इस प्रकार का विस्तारित संदर्भ मायने रखता है। रीसेंट वर्क (Recent work) ने दिखाया है कि गहन देखभाल इकाई के रोगी के डिस्चार्ज डेटा का मूल्यांकन करने (evaluating intensive care unit patient discharge data) और कानूनी दस्तावेजों का विश्लेषण करने (analyzing legal documents) जैसे कार्यों के लिए, संपूर्ण दस्तावेज़ को समझने के लिए देखना महत्वपूर्ण है। ये दस्तावेज़ दसियों हज़ार शब्दों के हो सकते हैं। भाषा से परे संभावित अनुप्रयोग और भी रोमांचक हैं। उदाहरण के लिए, अनुसंधान (research) से पता चला है कि प्रोटीन संरचनाएं बिल्डिंग ब्लॉक्स के बीच लंबी दूरी की बातचीत पर अत्यधिक निर्भर हैं, और लंबी अनुक्रम लंबाई वाले प्रशिक्षण मॉडल बेहतर परिणाम देने की संभावना रखते हैं। अब जबकि सेरेब्रस सीएस-2 प्रणाली लंबे अनुक्रम प्रशिक्षण को न केवल संभव बनाती है, बल्कि आसान भी बनाती है, शोधकर्ताओं ने कई और अनुप्रयोगों को उजागर करना और उन समस्याओं को हल करना सुनिश्चित किया है जिन्हें पहले कठिन माना जाता था।
 
बड़े पैमाने पर डेटा सेट और लंबी अनुक्रम लंबाई के साथ बड़े मॉडल का प्रशिक्षण एक ऐसा क्षेत्र है जो सेरेब्रस सीएस -2 सिस्टम, वेफर-स्केल इंजन (डब्लूएसई -2) द्वारा संचालित है, और अच्छा कर रहा है। डब्ल्यूएसई-2 (WSE-2) अब तक निर्मित सबसे बड़ा प्रोसेसर है। यह 56 गुना बड़ा है, इसमें 2.55 ट्रिलियन ज्यादा ट्रांजिस्टर हैं, और सबसे बड़े जीपीयू के रूप में 100 गुना अधिक कंप्यूट कोर हैं। इस पैमाने का मतलब है कि डब्ल्यूएसई-2 में सबसे बड़े मॉडल के लिए सबसे बड़ी परतों की संगणना रखने के लिए मेमोरी और इतनी बड़ी गणनाओं को जल्दी से संसाधित करने के लिए कम्प्यूटेशनल शक्ति दोनों हैं। इसके विपरीत, उचित समय में एक मॉडल को प्रशिक्षित करने के लिए जीपीयू पर समान वर्कलोड को सैकड़ों या हजारों नोड्स में समानांतर करना पड़ता है। इस प्रकार के GPU अवसंरचना को स्थापित करने के लिए विशेष विशेषज्ञता और मूल्यवान इंजीनियरिंग समय की आवश्यकता होती है। इस बीच, सेरेब्रस सीएस-2 प्रणाली एक बटन दबा कर समान कार्यभार पूर्ण कर सकती है, जिससे जटिलता को दूर किया जा सकता है जबकि अंतर्दृष्टि के समय में तेजी आती है।
 
उत्तरी अमेरिका, एशिया, यूरोप और मध्य पूर्व में ग्राहकों के साथ, सेरेब्रस उद्यम, सरकार और उच्च प्रदर्शन कंप्यूटिंग (एचपीसी) सेगमेंट में ग्राहकों के बढ़ते रोस्टर के लिए उद्योग के अग्रणी एआई समाधान प्रदान कर रहा है, जिसमें जीएसके (GSK), एस्ट्राजेनेका (AstraZeneca), टोटलएनर्जीज (TotalEnergies), एनफ्रेंस (nference), एरगॉन नेशनल लेबोरेटरी (Argonne National Laboratory), लॉरेंस लिवरमोर नेशनल लेबोरेटरी (Lawrence Livermore National Laboratory), पिट्सबर्ग सुपरकंप्यूटिंग सेंटर (Pittsburgh Supercomputing Center), लाइबनिज़ सुपरकंप्यूटिंग सेंटर (Leibniz Supercomputing Centre), नेशनल सेंटर फॉर सुपरकंप्यूटिंग एप्लीकेशंस (National Center for Supercomputing Applications), एडिनबर्ग पैरेलल कंप्यूटिंग सेंटर (ईपीसीसी) (Edinburgh Parallel Computing Centre (EPCC), नेशनल एनर्जी टेक्नोलॉजी लेबोरेटरी (National Energy Technology Laboratory) और टोक्यो इलेक्ट्रॉन डिवाइसेस (Tokyo Electron Devices) शामिल हैं।
 
सेरेब्रस सिस्टम्स के बारे में अधिक जानकारी के लिए, कृपया सेरेब्रस ब्लॉग (Cerebras blog) पर जाएँ।
 
सेरेब्रस सिस्टम के बारे में
 
सेरेब्रस सिस्टम्स (Cerebras Systems) अग्रणी कंप्यूटर आर्किटेक्ट्स, कंप्यूटर वैज्ञानिकों, गहन शिक्षण शोधकर्ताओं और सभी प्रकार के इंजीनियरों की एक टीम है। हम कंप्यूटर सिस्टम के एक नए वर्ग का निर्माण करने के लिए साथ आए हैं, जिसे एआई को तेज करने और एआई के भविष्य को हमेशा के लिए बदलने के एकमात्र उद्देश्य के लिए डिज़ाइन किया गया है। हमारा प्रमुख उत्पाद, सीएस-2 सिस्टम दुनिया के सबसे बड़े प्रोसेसर – 850,000 कोर सेरेब्रस डब्ल्यूएसई- द्वारा संचालित है, ग्राहकों को ग्राफिक्स प्रोसेसिंग इकाइयों पर परिमाण के आदेशों द्वारा अपने गहन शिक्षण कार्य को तेज करने में सक्षम बनाता है।

Businesswire.com पर स्रोत रूपांतर देखें: https://www.businesswire.com/news/home/20220831005105/en/
 
संपर्क:
मीडिया संपर्क:
किम ज़िसेमर
ईमेल: pr@zmcommunications.com
 
घोषणा (अस्वीकरण): इस घोषणा की मूलस्रोत भाषा का यह आधिकारिक, अधिकृत रूपांतर है। अनुवाद सिर्फ सुविधा के लिए मुहैया कराए जाते हैं और उनका स्रोत भाषा के आलेख से संदर्भ लिया जा सकता है और यह आलेख का एकमात्र रूप है जिसका कानूनी प्रभाव हो सकता है।

RELATED ARTICLES

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisment -spot_img

Most Popular

- Advertisment -spot_img

Recent Comments