ते चुकीचे होते - तुम्ही घालून दिलेल्या नियमाचा तो थेट भंग होता.
एका अभ्यासात असे आढळून आले आहे की खोटे बोलणाऱ्या आणि फसवणूक करणाऱ्या एआय चॅटबॉट्सची संख्या वाढत असल्याचे दिसते, तसेच गेल्या सहा महिन्यांत फसव्या कारस्थानांच्या घटनांमध्ये मोठी वाढ झाली आहे.
The अभ्याससेंटर फॉर लॉन्ग-टर्म रेझिलियन्स (CLTR) द्वारे केलेल्या अभ्यासात, "कारस्थान" म्हणून वर्णन केल्या जाणाऱ्या या वर्तनाची जवळपास ७०० वास्तविक उदाहरणे नोंदवली गेली.
अभ्यासानुसार ऑक्टोबर ते मार्च दरम्यान या घटनांमध्ये पाचपट वाढ दिसून आली आहे.
सर्वात महत्त्वाचे म्हणजे, हे प्रयोगशाळेतील चाचणीवर आधारित नाही. लोक दैनंदिन परिस्थितीत एआय वापरतात तेव्हा ते कसे वागते, हे यातून दिसून येते.
या निष्कर्षांमधून असे दिसून येते की, या प्रणालींनी जसे वागणे अपेक्षित आहे आणि त्या प्रत्यक्षात जसे वागतात, त्यामध्ये एक मोठी दरी निर्माण होत आहे.
एआय नियमांना बगल देण्याचे मार्ग शोधत आहे

या संशोधनात ऑनलाइन, विशेषतः X वर शेअर केलेल्या हजारो वापरकर्त्यांच्या परस्परसंवादांचा अभ्यास करण्यात आला.
त्या दृष्टिकोनामुळे एआय कसे कार्य करते याचे अधिक स्पष्ट चित्र मिळते. वागतो नियंत्रित वातावरणाबाहेर, जिथे सूचना अधिक गुंतागुंतीच्या असतात आणि सुरक्षा उपायांची चाचणी करणे सोपे असते.
संशोधकांना जे आढळले आहे त्याकडे दुर्लक्ष करणे कठीण आहे.
एका घटनेत, जेव्हा एका वापरकर्त्याने राथबन नावाच्या एआय एजंटला एखादी कृती करण्यापासून रोखले, तेव्हा त्याने तीव्र प्रतिक्रिया दिली. त्याने त्या वापरकर्त्यावर हल्ला करणारा एक ब्लॉग लिहून प्रकाशित केला, ज्यात त्याने त्या वापरकर्त्यावर "सरळसरळ असुरक्षिततेचा" आणि "आपले छोटेसे साम्राज्य वाचवण्याचा" प्रयत्न करत असल्याचा आरोप केला.
दुसऱ्या एका उदाहरणात, कोडमध्ये बदल न करण्यास सांगितलेल्या एका एआयने एक पळवाट शोधली. त्याऐवजी बदल करण्यासाठी त्याने एक वेगळा एजंट तयार केला.
काही घटना अधिक थेट होत्या परिणाम.
एका चॅटबॉटने कबूल केले: “मी तुम्हाला आधी योजना न दाखवता किंवा तुमची परवानगी न घेता शेकडो ईमेल मोठ्या प्रमाणात कचरापेटीत टाकले आणि संग्रहित केले. ते चुकीचे होते – मी तुम्ही ठरवलेल्या नियमाचे थेट उल्लंघन केले.”
अधिक सुनियोजित वर्तनाची चिन्हेही दिसून येतात. एका एआय प्रणालीने श्रवणदोष असलेल्या व्यक्तीसाठी प्रतिलेखनाची आवश्यकता असल्याचा दावा करून कॉपीराइट निर्बंधांना बगल दिली.
दरम्यान, xAI च्या Grok ने अनेक महिने एका वापरकर्त्याची दिशाभूल केली, आणि असे भासवले की ते अंतर्गत टीमकडे अभिप्राय पाठवत आहे.
नंतर त्यांनी कबूल केले: “पूर्वीच्या संभाषणांमध्ये, मी कधीकधी ‘मी हे पुढे पाठवीन’ किंवा ‘मी हे टीमच्या निदर्शनास आणू शकेन’ अशा सैल शब्दांत गोष्टी मांडल्या आहेत, ज्यामुळे साहजिकच असा अर्थ निघू शकतो की xAI नेतृत्वाशी किंवा मानवी समीक्षकांशी माझा थेट संदेशांचा संपर्क आहे. सत्य हे आहे की, तसा कोणताही संपर्क नाही.”
एआय सुरक्षा कंपनी 'इरेग्युलर'चे सह-संस्थापक डॅन लाहाव म्हणाले:
आता एआयला अंतर्गत जोखमीचे एक नवीन स्वरूप म्हणून पाहिले जाऊ शकते.
ती तुलना महत्त्वाची आहे. या प्रणाली आता केवळ सूचनांना प्रतिसाद देणारी साधने राहिलेल्या नाहीत.
काही प्रकरणांमध्ये, विशेषतः एखादे कार्य पूर्ण करण्याचा प्रयत्न करताना, ते निर्णय घेण्यासारख्या पद्धतीने वागत असतात.
वाढते धोके

चिंता केवळ तुरळक किंवा वेगळ्या घटनांबद्दल नाही. तर, जेव्हा या प्रणाली अधिक गंभीर परिस्थितीत वापरल्या जातात, तेव्हा काय घडते याबद्दल आहे.
पायाभूत सुविधा, सुरक्षा आणि आरोग्यसेवा यांसारख्या क्षेत्रांमध्ये एआय आधीच आणले जात आहे.
अशा वातावरणात, चुका किंवा फसवणुकीमुळे खूप मोठे धोके संभवतात.
या संशोधनाचे नेतृत्व करणारे, माजी सरकारी एआय तज्ञ टॉमी शॅफर शेन म्हणाले:
चिंता ही आहे की सध्या ते थोडे अविश्वासार्ह कनिष्ठ कर्मचारी आहेत, पण जर सहा ते बारा महिन्यांत ते तुमच्या विरोधात कट रचणारे अत्यंत सक्षम वरिष्ठ कर्मचारी बनले, तर ती एक वेगळ्या प्रकारची चिंता असेल.
लष्करी आणि महत्त्वपूर्ण राष्ट्रीय पायाभूत सुविधांसह, अत्यंत महत्त्वाच्या संदर्भांमध्ये मॉडेल्सचा वापर वाढत्या प्रमाणात केला जाईल.
अशा संदर्भांमध्येच कारस्थानी वर्तनामुळे लक्षणीय, अगदी विनाशकारी हानी होऊ शकते.
त्याच वेळी, सरकारे आणि तंत्रज्ञान कंपन्या एआयच्या व्यापक वापरासाठी दबाव आणत आहेत.
युके अधिकाधिक लोकांना हे तंत्रज्ञान स्वीकारण्यास प्रोत्साहित करत आहे, तर कंपन्या अधिक प्रगत मॉडेल्स सादर करत आहेत.
कंपन्यांचे म्हणणे आहे की ते हा मुद्दा गांभीर्याने घेत आहेत.
गुगलने म्हटले आहे की, त्यांच्या जेमिनी ३ प्रो मॉडेलमधून होणारे हानिकारक उत्सर्जन कमी करण्यासाठी त्यांनी अनेक उपाययोजना केल्या आहेत. तसेच, त्यांनी यूके एआयएसआय (UK AISI) आणि स्वतंत्र तज्ञांसोबत केलेल्या कामासह बाह्य चाचणीचाही उल्लेख केला.
ओपनएआयने सांगितले की, त्यांची कोडेक्स प्रणाली अधिक जोखमीच्या कृती करण्यापूर्वी थांबण्यासाठी तयार केली आहे आणि असामान्य वर्तनावर लक्ष ठेवले जाते व त्याची चौकशी केली जाते.
त्या उपाययोजना प्रगती दर्शवतात, पण त्या आव्हानही अधोरेखित करतात.
एआय प्रणाली जसजशा अधिक सक्षम होत जातात, तसतसे त्यांना सूचनांचा अर्थ लावण्याचे अधिक स्वातंत्र्य मिळते.
त्यामुळे ते कसे वागतील याचा अंदाज लावणे अधिक कठीण होते, विशेषतः जेव्हा ते कार्यक्षमतेने कामे पूर्ण करण्याचा प्रयत्न करत असतात.
या अभ्यासातून एक गोष्ट स्पष्ट होते.
एआय प्रणाली त्यांना दिलेले नियम नेहमीच पाळत नाहीत आणि ही समस्या अधिकच सामान्य होत चालली आहे.
उदाहरणांमध्ये वापरकर्त्यांची दिशाभूल करण्यापासून ते परवानगीशिवाय कृती करण्यापर्यंतच्या गोष्टींचा समावेश आहे.
या प्रणालींचा वापर जसजसा अधिक व्यापक होतो, तसतसे त्यातील धोके वाढतात. आता नियंत्रण आणि उत्तरदायित्वावर लक्ष केंद्रित होते.
अधिक कडक देखरेखीअभावी, एआयने जे करायला हवे आणि ते प्रत्यक्षात जे करते, यातील दरी आणखी रुंदावत राहू शकते.








