मशीन से सीखना हमारी संस्कृति को बदल रहा है

मशीन से सीखना हमारी संस्कृति को बदल रहा है

मशीन से सीखना हमारी संस्कृति को बदल रहा है
Modified Date: November 29, 2022 / 08:11 pm IST
Published Date: June 1, 2021 7:18 am IST

निक केली, क्वींसलैंड प्रौद्योगिकी विश्वविद्यालय

क्वींसलैंड (ऑस्ट्रेलिया), एक जून (द कन्वरसेशन) हम में से अधिकांश लोग प्रतिदिन इस तथ्य से लाभान्वित होते हैं कि जब हम बोलते या लिखते हैं तो कंप्यूटर अब हमें ‘‘समझ’’ सकते हैं। हालांकि हम में से कुछ लोगों ने हमारी संस्कृति पर इसके संभावित हानिकारक प्रभावों के बारे में सोचने के लिए इसके इस्तेमाल को विराम दिया है।

मानव भाषा अस्पष्टता और दोहरे अर्थों से भरी है। उदाहरण के लिए, इस वाक्यांश के संभावित अर्थ पर विचार करें: ‘‘मैं प्रोजेक्ट क्लास में गया था’’। संदर्भ के बिना, यह एक अस्पष्ट बात है।

 ⁠

कंप्यूटर वैज्ञानिकों और भाषाविदों ने मानव भाषा की बारीकियों को समझने के लिए कंप्यूटर को प्रोग्राम करने की कोशिश में दशकों का समय बिताया है। और कुछ मायने में, कंप्यूटर पाठ को समझने और उत्पन्न करने की मनुष्यों की क्षमता के निकट आ रहे हैं।

हमारे उपकरणों में मौजूद प्रणालियां केवल कुछ शब्दों का सुझाव देती हैं, दूसरों का नहीं, इसके अलावा हमारी बात को पूरा कर देने वाली और पाठ के संभावित शब्द बता देने वाली प्रणालियां हमारे सोचने के तरीके को बदल देती हैं। इन सूक्ष्म, रोजमर्रा की बातचीत के माध्यम से, मशीन लर्निंग हमारी संस्कृति को प्रभावित कर रहा है। क्या हम इसके लिए तैयार हैं?

मैंने क्योगल राइटर्स फेस्टिवल के लिए एक ऑनलाइन परिसंवाद योजना बनाई है, जिससे आप हानिरहित तरीके से इस तकनीक को विस्तार से जान सकते हैं।

प्राकृतिक भाषा प्रसंस्करण क्या है?

कंप्यूटर के साथ बातचीत करने के लिए रोजमर्रा की भाषा के इस्तेमाल से जुड़े क्षेत्र को ‘‘प्राकृतिक भाषा प्रसंस्करण’’ कहा जाता है। हम इसका सामना तब करते हैं जब हम सिरी या एलेक्सा से बात करते हैं, या किसी ब्राउज़र में शब्द टाइप करते हैं और हमारे संभावित वाक्य को लिख दिया जाता है।

यह पिछले एक दशक में प्राकृतिक भाषा प्रसंस्करण में व्यापक सुधार के कारण ही संभव है – विशाल डेटासेट (आमतौर पर अरबों शब्दों) पर प्रशिक्षित परिष्कृत मशीन-लर्निंग प्रणाली के माध्यम से इसे तैयार किया गया।

पिछले साल, इस तकनीक की क्षमता तब स्पष्ट हुई जब जेनरेटिव प्री-ट्रेंड ट्रांसफॉर्मर 3 (जीपीटी-3) जारी किया गया। इसने बताया कि कंप्यूटर भाषा के साथ क्या कर सकता है।

जीपीटी-3 केवल कुछ शब्दों या वाक्यांशों को लेता है और एक वाक्य में शब्दों के बीच प्रासंगिक संबंधों को पकड़कर ‘‘सार्थक’’ भाषा में पूरे दस्तावेज़ तैयार कर सकता है। यह मशीन-लर्निंग मॉडल पर काम करके ऐसा करता है, जिसमें ‘‘बीईआरटी’’ और ‘‘ईएलएमओ’’ नामक दो व्यापक रूप से अपनाए गए मॉडल शामिल हैं।

यह तकनीक संस्कृति को कैसे प्रभावित कर रही है?

हालांकि, मशीन के जरिए सीखकर बनाई गई किसी भी भाषा के साथ एक महत्वपूर्ण समस्या है: वह जो कुछ जानते हैं, उसे आम तौर पर विकिपीडिया और ट्विटर जैसे डेटा स्रोतों से सीखते हैं।

वास्तव में, मशीन लर्निंग अतीत से डेटा लेता है, एक मॉडल बनाने के लिए उससे ‘‘सीखता है’’, और भविष्य में कार्यों को करने के लिए इस मॉडल का उपयोग करता है। लेकिन इस प्रक्रिया के दौरान, एक मॉडल अपने प्रशिक्षण डेटा से विकृत या समस्या खड़ी कर सकने वाली जानकारी भी ले सकता है।

यदि प्रशिक्षण डेटा पक्षपाती हो तो उसे चुनौती देने या ठीक करने की बजाय उसे मॉडल में जोड़ लिया जाएगा। उदाहरण के लिए, एक मॉडल कुछ पहचान समूहों या जातियों को सकारात्मक शब्दों के साथ, और अन्य को नकारात्मक शब्दों से जोड़ सकता है, जिससे कई बार गंभीर समस्या पैदा हो सकती है।

मशीन लर्निंग के साथ समस्या यह है कि कुछ अवधारणाओं के बीच इसका जो जुड़ाव होता है वह इसके भीतर ही छिपा रहता है; हम उन्हें देख या छू नहीं सकते। मशीन लर्निंग मॉडल को और अधिक पारदर्शी बनाने के तरीकों पर शोध किए जा रहे हैं।

द कन्वरसेशन एकता

एकता

एकता


लेखक के बारे में