मार्च 28, 2023

आर्टिफिशियल इंटेलिजेंस: एआई मानव दृष्टि को पुन: उत्पन्न करने में विफल क्यों है I

जबकि कंप्यूटर मानव मस्तिष्क की तुलना में एक परिचित चेहरे या आने वाले वाहन को तेजी से पहचानने में सक्षम हो सकते हैं, उनकी सटीकता संदिग्ध है।

कंप्यूटर को आने वाले डेटा को प्रोसेस करना सिखाया जा सकता है, जैसे चेहरे और कारों को देखना, आर्टिफिशियल इंटेलिजेंस (एआई) का उपयोग करना जिसे डीप न्यूरल नेटवर्क या डीप लर्निंग के रूप में जाना जाता है। इस प्रकार की मशीन सीखने की प्रक्रिया एक स्तरित संरचना में इंटरकनेक्टेड नोड्स या न्यूरॉन्स का उपयोग करती है जो मानव मस्तिष्क जैसा दिखता है।

प्रमुख शब्द कंप्यूटर के रूप में “सदृश” है, गहरी शिक्षा की शक्ति और वादे के बावजूद, अभी तक मानव गणनाओं में महारत हासिल नहीं की है और महत्वपूर्ण रूप से, शरीर और मस्तिष्क के बीच संचार और कनेक्शन पाया जाता है, विशेष रूप से जब दृश्य पहचान की बात आती है, के अनुसार कनाडा में वेस्टर्न यूनिवर्सिटी के न्यूरोइमेजिंग विशेषज्ञ मैरीके मुर के नेतृत्व में एक अध्ययन।

मुर ने कहा, “होनहार होने पर, गहरे तंत्रिका नेटवर्क मानव दृष्टि के सही कम्प्यूटेशनल मॉडल से बहुत दूर हैं।”

पिछले अध्ययनों से पता चला है कि गहरी शिक्षा मानव दृश्य पहचान को पूरी तरह से पुन: पेश नहीं कर सकती है, लेकिन कुछ लोगों ने यह स्थापित करने का प्रयास किया है कि मानव दृष्टि के कौन से पहलू गहन शिक्षा का अनुकरण करने में विफल रहते हैं।

टीम ने मैग्नेटोएन्सेफलोग्राफी (एमईजी) नामक एक गैर-आक्रामक चिकित्सा परीक्षण का उपयोग किया जो मस्तिष्क के विद्युत धाराओं द्वारा उत्पन्न चुंबकीय क्षेत्र को मापता है। वस्तु देखने के दौरान मानव पर्यवेक्षकों से प्राप्त एमईजी डेटा का उपयोग करते हुए, मूर और उनकी टीम ने विफलता के एक प्रमुख बिंदु का पता लगाया।

अपनी रुचि की कहानियों की खोज करें


उन्होंने पाया कि “आंख,” “पहिया,” और “चेहरे” जैसे वस्तुओं के आसानी से नाम योग्य हिस्से, मानव तंत्रिका गतिकी में विचरण के लिए जिम्मेदार हो सकते हैं जो कि गहन शिक्षा प्रदान कर सकते हैं। इन निष्कर्षों से पता चलता है कि गहरे तंत्रिका नेटवर्क और मनुष्य दृश्य पहचान के लिए विभिन्न वस्तु सुविधाओं पर भरोसा कर सकते हैं और मॉडल सुधार के लिए दिशानिर्देश प्रदान कर सकते हैं,” मुर ने कहा।

अध्ययन से पता चलता है कि गहरे तंत्रिका नेटवर्क मानव पर्यवेक्षकों में मापी गई तंत्रिका प्रतिक्रियाओं के लिए पूरी तरह से हिसाब नहीं दे सकते हैं, जबकि व्यक्ति चेहरे और जानवरों सहित वस्तुओं की तस्वीरें देख रहे हैं, और वास्तविक दुनिया की सेटिंग में गहन शिक्षण मॉडल के उपयोग के लिए प्रमुख निहितार्थ हैं, जैसे कि स्व- वाहन चलाना।

मुर ने कहा, “यह खोज इस बारे में सुराग प्रदान करती है कि छवियों में तंत्रिका नेटवर्क क्या समझने में असफल हो रहे हैं, अर्थात् दृश्य विशेषताएं जो पारिस्थितिक रूप से प्रासंगिक वस्तु श्रेणियों जैसे चेहरे और जानवरों का संकेतक हैं।”

“हम सुझाव देते हैं कि तंत्रिका नेटवर्क को मस्तिष्क के मॉडल के रूप में सुधार किया जा सकता है, उन्हें एक प्रशिक्षण शासन की तरह अधिक मानवीय सीखने का अनुभव देकर, जो विकास के दौरान मनुष्यों के व्यवहार के दबावों पर अधिक जोर देता है।”

उदाहरण के लिए, मनुष्यों के लिए यह महत्वपूर्ण है कि वे शीघ्रता से यह पहचानें कि कोई वस्तु एक आने वाला जानवर है या नहीं, और यदि ऐसा है, तो इसके अगले परिणामी कदम की भविष्यवाणी करना। प्रशिक्षण के दौरान इन दबावों को एकीकृत करने से मानव दृष्टि को मॉडल करने के लिए गहन शिक्षण दृष्टिकोण की क्षमता में लाभ हो सकता है।

काम द जर्नल ऑफ न्यूरोसाइंस में प्रकाशित हुआ है।

महत्वपूर्ण प्रौद्योगिकी और स्टार्टअप समाचारों से अवगत रहें। नवीनतम और अवश्य पढ़ी जाने वाली तकनीकी खबरों के लिए हमारे दैनिक न्यूज़लेटर की सदस्यता लें, जो सीधे आपके इनबॉक्स में पहुंचाई जाती है।