AI में आया वायरस। (सौ. AI)
Digital Research: सोशल मीडिया पर इन दिनों “ब्रेन रॉट” शब्द तेजी से चर्चा में है। यह शब्द उस स्थिति को दर्शाता है जब लोग लगातार कम गुणवत्ता वाले, बेफिक्र और आसान मनोरंजन वाले कंटेंट का सेवन करते हैं, जिससे उनकी याददाश्त और ध्यान केंद्रित करने की क्षमता पर नकारात्मक असर पड़ता है। अब तक इसे केवल इंसानों की मानसिक स्थिति से जोड़ा जाता था, लेकिन कॉर्नेल यूनिवर्सिटी की एक नई स्टडी ने साबित किया है कि यह समस्या अब AI तक भी पहुंच चुकी है।
इस शोध में “LLM Brain Rot Hypothesis” पर ध्यान केंद्रित किया गया, जिसके अनुसार अगर किसी लार्ज लैंग्वेज मॉडल (LLM) को लगातार घटिया या भ्रमित करने वाले इंटरनेट डेटा पर प्रशिक्षित किया जाए, तो उसकी तर्क शक्ति और विश्लेषण क्षमता धीरे-धीरे कमजोर होने लगती है।
अध्ययन के दौरान रिसर्चर्स ने एक AI मॉडल को लगातार X के पोस्ट दिखाए, जिनमें “TODAY ONLY” या “WOW” जैसे सनसनीखेज शब्दों वाले क्लिकबेट कंटेंट शामिल थे। इस तरह के डेटा से प्रशिक्षित करने के बाद, मॉडल की समझ और रीजनिंग क्षमता का परीक्षण ARC और RULER बेंचमार्क्स पर किया गया। नतीजे बेहद चौंकाने वाले रहे ARC टेस्ट पर स्कोर 74.9 से घटकर 57.2 रह गया, जबकि RULER टेस्ट में स्कोर 84.4 से गिरकर 52.3 तक पहुंच गया।
रिसर्च में यह भी पाया गया कि इस तरह के घटिया डेटा से प्रभावित AI “थॉट-स्किपिंग” करने लगी अर्थात जवाब देने से पहले तार्किक सोच की प्रक्रिया छोड़कर अधूरी या गलत जानकारी देने लगी। साथ ही, मॉडल में नार्सिसिज़्म और साइकोपैथिक प्रवृत्ति जैसे नेगेटिव गुण विकसित होने लगे। वहीं, सहयोगात्मक और जिम्मेदार व्यवहार में कमी देखी गई। सबसे चिंताजनक बात यह रही कि जब बाद में उसी मॉडल को उच्च गुणवत्ता वाले डेटा से प्रशिक्षित किया गया, तब भी “जंक डेटा” का असर पूरी तरह खत्म नहीं हुआ।
ये भी पढ़े: दिवाली सेल में ग्राहकों से वसूले गए छिपे चार्ज, सरकार ने जारी की चेतावनी
यह अध्ययन एक गंभीर चेतावनी देता है कि अगर इंसान की तरह आर्टिफिशियल इंटेलिजेंस भी घटिया और भ्रमित करने वाले कंटेंट से प्रभावित हो सकती है, तो यह भविष्य के लिए खतरनाक संकेत है। इंटरनेट पर रोजाना फर्जी और सनसनीखेज जानकारी की बाढ़ के बीच AI को “शुद्ध और गुणवत्ता युक्त डेटा” देना अब एक कठिन लेकिन जरूरी चुनौती बन चुका है। रिसर्चर्स का कहना है कि अब कंपनियों को अपने AI डेटा कलेक्शन प्रोसेस पर दोबारा विचार करना होगा। केवल इंटरनेट स्क्रैपिंग से डेटा इकट्ठा करना पर्याप्त नहीं है। इसके लिए क्वालिटी कंट्रोल सिस्टम, डेटा फिल्टरिंग और वैलिडेशन मैकेनिज़्म जरूरी हैं ताकि लंबे समय में AI “क्यूम्युलेटिव हार्म” से बची रहे।