ऑपरेटर विविध कार्ये स्वयंचलित करण्याचे वचन देतो
OpenAI चे CEO सॅम ऑल्टमन यांच्या मते, 2025 हे AI एजंट्ससाठी परिवर्तनकारी वर्ष ठरणार आहे.
वर्षाच्या सुरुवातीला एका ब्लॉग पोस्टमध्ये, ऑल्टमॅनने अशा साधनांमध्ये मोठी झेप वर्तवली जी कार्ये स्वयंचलित करू शकतात आणि वापरकर्त्यांच्या वतीने स्वतंत्रपणे कृती करू शकतात.
आता, OpenAI ने ती दृष्टी प्रत्यक्षात आणण्याचा पहिला धाडसी प्रयत्न केला आहे.
23 जानेवारी, 2025 रोजी, OpenAI ने ऑपरेटरच्या संशोधन पूर्वावलोकनाची घोषणा केली, एक सामान्य-उद्देशीय एआय एजंट जो वेबवर नेव्हिगेट करण्यास आणि स्वायत्तपणे कार्ये करण्यास सक्षम आहे.
सुरुवातीला यूएस वापरकर्त्यांसाठी ChatGPT च्या $200 प्रो सबस्क्रिप्शन प्लॅनवर उपलब्ध, ऑपरेटरचे उद्दिष्ट नजीकच्या भविष्यात OpenAI च्या प्लस, टीम आणि एंटरप्राइझ टियर्समध्ये विस्तारण्याचे आहे.
ऑल्टमनने शेअर केले की युरोपच्या रोलआउटला जास्त वेळ लागू शकतो तरीही ऑपरेटर लवकरच इतर देशांमध्ये उपलब्ध होईल.
हे वैशिष्ट्य operator.chatgpt.com द्वारे प्रवेश करण्यायोग्य आहे, आणि OpenAI ची योजना अखेरीस सर्व ChatGPT क्लायंटमध्ये समाकलित करण्याची योजना आहे.
ऑपरेटर काय करू शकतो

प्रवासी निवास बुक करण्यापासून रेस्टॉरंट आरक्षणे आणि ऑनलाइन खरेदी करण्यापर्यंत, ऑपरेटर विविध कार्ये स्वयंचलित करण्याचे वचन देतो.
त्याच्या इंटरफेसमध्ये खरेदी, डिलिव्हरी, जेवण आणि प्रवास यासारख्या कार्य श्रेणींचा समावेश आहे, प्रत्येक वेगवेगळ्या प्रकारच्या ऑटोमेशनसाठी तयार केलेला आहे.
सक्रिय केल्यावर, ऑपरेटर एका पॉप-अप विंडोमध्ये एक समर्पित वेब ब्राउझर लाँच करतो, ज्यामुळे वापरकर्त्यांना तो रिअल-टाइममध्ये करत असलेल्या विशिष्ट क्रिया पाहण्याची परवानगी देतो.
वापरकर्ते कोणत्याही क्षणी ताब्यात घेऊ शकतात, कारण ऑपरेटर वापरकर्त्याच्या प्राथमिक ब्राउझरऐवजी स्वतःच्या ब्राउझरद्वारे ऑपरेट करतो.
ऑपरेटरच्या केंद्रस्थानी ओपनएआयचे कॉम्प्युटर-यूजिंग एजंट (CUA) मॉडेल आहे, जे OpenAI च्या GPT-4o मॉडेलच्या प्रगत तर्क क्षमतांना संगणक दृष्टी क्षमतेसह एकत्र करते.
हे CUA ला एखाद्या मनुष्याप्रमाणे वेबसाइटशी संवाद साधण्यास सक्षम करते—बटणांवर क्लिक करणे, मेनू नेव्हिगेट करणे आणि फॉर्म भरणे—डेव्हलपर-फेसिंग API ची आवश्यकता न घेता.
सुरक्षितता आणि मर्यादा
ऑपरेटर सुरक्षितपणे आणि जबाबदारीने काम करतो याची खात्री करण्यासाठी OpenAI ने अनेक खबरदारी घेतली आहे.
उदाहरणार्थ, ऑर्डर देणे किंवा ईमेल पाठवणे यासारख्या बाह्य परिणामांसह कार्यांना अंतिम रूप देण्याआधी वापरकर्त्याची पुष्टी विचारण्यासाठी CUA मॉडेल डिझाइन केले आहे.
ऑपरेटर सेवा कराराच्या अटींचा आदर करतो याची खात्री करण्यासाठी OpenAI ने DoorDash, eBay, Instacart, Priceline, StubHub आणि Uber सारख्या कंपन्यांशी देखील सहकार्य केले आहे.
तथापि, ऑपरेटर त्याच्या मर्यादांशिवाय नाही.
OpenAI कबूल करते की CUA अद्याप जटिल कार्ये हाताळू शकत नाही, जसे की तपशीलवार स्लाइडशो तयार करणे किंवा क्लिष्ट कॅलेंडर सिस्टम व्यवस्थापित करणे.
बँकिंग व्यवहारांसारख्या काही क्रियांना सक्रिय वापरकर्ता पर्यवेक्षण आवश्यक आहे आणि ऑपरेटर क्रेडिट कार्ड तपशील इनपुट करण्यासारखी संवेदनशील कार्ये हाताळणार नाही.
याव्यतिरिक्त, वापर दर मर्यादा आणि काही सुरक्षा निर्बंध आहेत. उदाहरणार्थ, ऑपरेटर त्याच्या वर्तमान पुनरावृत्तीमध्ये ईमेल पाठवणार नाही किंवा कॅलेंडर इव्हेंट हटवणार नाही.
OpenAI ने नोंदवले:
"सध्या, ऑपरेटर अनेक जटिल किंवा विशेष कार्ये विश्वसनीयरित्या हाताळू शकत नाही."
हे जोडले की ऑपरेटर जटिल इंटरफेस किंवा कॅप्चा चेकवर "अडकले" जाऊ शकते, वापरकर्त्यांना हस्तक्षेप करण्यास प्रवृत्त करते.
या मर्यादा असूनही, ऑपरेटर एक स्वायत्त एआय एजंट तयार करण्याचा अद्यापही OpenAI चा सर्वात धाडसी प्रयत्न दर्शवतो.
संशयास्पद ॲक्टिव्हिटी आढळल्यास अंमलबजावणीला विराम देण्यासाठी सेफगार्ड्स आहेत आणि हे सेफगार्ड्स सतत अपडेट करण्यासाठी ओपनएआय स्वयंचलित आणि मानवी-पुनरावलोकन केलेल्या दोन्ही पाइपलाइनचा वापर करते.
ब्रॉडर एआय लँडस्केप
Google आणि Anthropic सह इतर टेक दिग्गज देखील AI एजंट्ससह प्रयोग करत असताना ऑपरेटरचे प्रकाशन झाले.
ही साधने केवळ माहितीवर प्रक्रिया करूनच नव्हे तर स्वायत्तपणे कृती करून Siri किंवा Alexa सारख्या पारंपारिक आभासी सहाय्यकांहून पुढे जाण्याचे वचन देतात.
तथापि, ही वाढलेली कार्यक्षमता सुरक्षा धोके देखील आणते, जसे की फिशिंग स्कॅम किंवा स्वयंचलित DDoS हल्ल्यांची संभाव्यता.
ओपनएआयचे ऑपरेटरचे सावध रोलआउट तंत्रज्ञानाच्या शक्यतांचा शोध घेत असताना या जोखीम कमी करण्यावर त्याचे लक्ष केंद्रित करते.
ऑल्टमॅनचे उपक्रम OpenAI च्या पलीकडे विस्तारले आहेत, प्रकल्पांचे नेटवर्क तयार करतात जे या AI-केंद्रित भविष्याला समर्थन देतात.
असाच एक उपक्रम म्हणजे वर्ल्ड, ऑल्टमन आणि ॲलेक्स ब्लानिया यांच्या टूल्स फॉर ह्युमॅनिटीचा प्रकल्प.
पूर्वी Worldcoin म्हणून ओळखल्या जाणाऱ्या, AI एजंट्सपासून मानवांना ऑनलाइन वेगळे करण्याच्या आव्हानाला सामोरे जाण्याचे जागतिक उद्दिष्ट आहे.
सिल्व्हर मेटल ऑर्बसह एखाद्या व्यक्तीचे नेत्रगोलक स्कॅन करून, कोणीतरी माणूस आहे हे सत्यापित करण्यासाठी वर्ल्ड एक अद्वितीय ब्लॉकचेन-आधारित आयडेंटिफायर प्रदान करते.
हे "मानवी पुरावा" साधन वास्तविक लोकांच्या वतीने काम करणाऱ्या एआय एजंटची देखील पडताळणी करू शकते.
टियागो सदा, टूल्स फॉर ह्युमॅनिटीचे मुख्य उत्पादन अधिकारी म्हणाले:
"तुमचा 'व्यक्तित्वाचा पुरावा' एजंटकडे सोपवण्याची आणि तुमच्या वतीने काम करू देण्याची ही कल्पना खरोखरच खूप महत्त्वाची आहे."
जगातील आयडी तंत्रज्ञान एआय एजंटना वापरकर्त्यांच्या वतीने कार्य करण्यासाठी परवाना देऊ शकते, व्यवसायांना त्यांच्या प्लॅटफॉर्मच्या सुरक्षिततेशी तडजोड न करता सत्यापित एजंटांशी संवाद साधण्यास सक्षम करते.
AI च्या आसपास बांधलेले भविष्य
Uber आणि Instacart सारख्या प्लॅटफॉर्मसह OpenAI ची भागीदारी व्यवसाय वापरकर्त्यांशी कसा संवाद साधतात हे बदलण्याचे संकेत देते.
एआय एजंट अधिक सक्षम होत असताना, कंपन्यांना भविष्याशी जुळवून घेण्याची आवश्यकता असू शकते जिथे व्यक्तींऐवजी सत्यापित एजंटद्वारे अनेक परस्परसंवाद सुलभ केले जातात.
या परस्परसंवादांमध्ये विश्वास आणि सुरक्षितता सुनिश्चित करण्यासाठी जगातील "मानवांचा पुरावा" प्रणाली सारखी साधने महत्त्वपूर्ण भूमिका बजावू शकतात.
ऑल्टमॅनसाठी, AI ची ही दृष्टी त्याच्या इतर उपक्रमांसह संरेखित करते, ज्यात Helion Energy, एक न्युक्लियर फ्यूजन स्टार्टअप जे OpenAI च्या डेटा सेंटर्सला एक दिवस शक्ती देऊ शकते आणि Retro Biosciences, एक दीर्घायुष्य विज्ञान स्टार्टअप आहे जे आधीच OpenAI च्या मॉडेल्सचा फायदा घेत आहे.
ऑपरेटरच्या लॉन्चसह, OpenAI स्वायत्त AI एजंट्सच्या जगात पहिले मोठे पाऊल टाकत आहे.
जसजसे तंत्रज्ञान परिपक्व होत जाते, तसतसे आम्ही इंटरनेट कसे वापरतो, उद्योगांना आकार देतो आणि नवीन शक्यता अनलॉक करतो हे ते पुन्हा परिभाषित करू शकते.
2025 हे वर्ष AI एजंट्ससाठी अत्यंत महत्त्वाचे ठरू शकते आणि OpenAI चे ऑपरेटर चार्जचे नेतृत्व करत आहे.