ARC Prizes ने लॉन्च किया अब तक का सबसे कठिन AI बेंचमार्क

editor_jharkhand
0 0
Read Time:7 Minute, 3 Second

ARC Prizes ने ARC-AGI-2 नामक अपनी अब तक की सबसे कठिन AI चुनौती शुरू कर दी है और इसके साथ ही 2025 प्रतियोगिता की घोषणा की है, जिसमें कुल $1 मिलियन के इनाम रखे गए हैं

जैसे-जैसे AI संकीर्ण कार्यों से आगे बढ़कर सामान्य और अनुकूलनीय बुद्धिमत्ता की ओर बढ़ रहा है, वैसे-वैसे ARC-AGI-2 का उद्देश्य AI की सीमाओं को उजागर करना और नवाचार को बढ़ावा देना है।

“एक अच्छा AGI बेंचमार्क प्रगति का संकेत देता है। एक बेहतर बेंचमार्क क्षमताओं को स्पष्ट रूप से अलग करता है। लेकिन सबसे बेहतरीन बेंचमार्क न केवल यह सब करता है, बल्कि अनुसंधान को प्रेरित करता है और नवाचार का मार्गदर्शन भी करता है,” ARC Prize टीम का कहना है।

ARC-AGI-2 का लक्ष्य इसी ‘बेहतरीन’ श्रेणी में आना है।

सिर्फ याद रखने से आगे बढ़कर

2019 में स्थापित होने के बाद से, ARC Prize शोधकर्ताओं के लिए AGI (Artificial General Intelligence) की दिशा में एक ‘North Star’ साबित हुआ है

पहले के ARC-AGI-1 बेंचमार्क ने फ्लूइड इंटेलिजेंस यानी नई और अनदेखी चुनौतियों के लिए अनुकूल रूप से सीखने की क्षमता को मापने पर जोर दिया। यह केवल याद रखने और रटे-रटाए उत्तरों पर आधारित अन्य बेंचमार्क से बिल्कुल अलग था।

ARC Prize का उद्देश्य सिर्फ AI प्रगति को मापना ही नहीं, बल्कि अनुसंधान को प्रेरित करना और वैज्ञानिक सफलता की समयसीमा को तेज करना भी है

2024 के अंत में OpenAI का o3 जब ARC-AGI-1 पर जांचा गया, तो उसमें देखा गया कि बड़े भाषा मॉडल (LLMs) और लॉजिकल रीजनिंग सिस्टम का संयोजन AI को महज याद करने से आगे ले जा सकता है

हालांकि, o3 जैसे सिस्टम अभी भी अक्षम हैं और इन्हें ट्रेनिंग के दौरान भारी मानवीय हस्तक्षेप की जरूरत पड़ती है। यही चुनौती हल करने के लिए ARC Prize ने ARC-AGI-2 लॉन्च किया है।

ARC-AGI-2: इंसान और मशीन के बीच की खाई को पाटना

ARC-AGI-2 AI के लिए कठिन, लेकिन इंसानों के लिए सहज बना हुआ है। अभी तक, AI सिस्टम इस पर सिंगल-डिजिट स्कोर ही हासिल कर पा रहे हैं, जबकि इंसान हर कार्य को दो प्रयासों में हल कर सकते हैं

तो, ARC-AGI-2 को खास क्या बनाता है? इसका डिज़ाइन ऐसा है कि “जो कार्य इंसानों के लिए आसान हैं, वे AI के लिए बेहद कठिन या असंभव साबित होते हैं।”

इस बेंचमार्क में कई जटिल तत्व शामिल किए गए हैं, जैसे:

  • प्रतीकात्मक व्याख्या (Symbolic Interpretation): AI को प्रतीकों का अर्थ समझने में कठिनाई होती है, जबकि इंसान इन्हें आसानी से समझ लेते हैं।
  • संयुक्त तर्क (Compositional Reasoning): जब AI को एक साथ कई नियमों को लागू करना पड़ता है, तो वह लड़खड़ा जाता है।
  • प्रासंगिक नियम अनुप्रयोग (Contextual Rule Application): AI जटिल परिस्थितियों में नियमों को सही तरीके से लागू नहीं कर पाता और सतही पैटर्न पर ध्यान केंद्रित करता है।

अधिकांश बेंचमार्क AI की ‘सुपरह्यूमन’ क्षमताओं को मापने पर ध्यान देते हैं, लेकिन ARC-AGI उस अंतर को उजागर करता है जहां AI अभी भी इंसानी अनुकूलता और सहजता से कोसों दूर है

बुद्धिमत्ता में दक्षता की भूमिका

AI की क्षमताओं को सिर्फ समस्या हल करने की योग्यता से नहीं, बल्कि कितने कुशल तरीके से यह किया जाता है, इस आधार पर भी मापा जाना चाहिए

कुछ वास्तविक उदाहरण देखें:

  • इंसानी विशेषज्ञता: ARC-AGI-2 कार्यों को 100% सटीकता के साथ मात्र $17 प्रति कार्य की लागत पर हल कर सकती है
  • OpenAI का o3 मॉडल: अनुमानतः केवल 4% सफलता दर के साथ प्रति कार्य $200 खर्च करता है

ये आंकड़े AI और मानव बुद्धिमत्ता के बीच दक्षता अंतर को दर्शाते हैं। ARC Prize ने आगे से सिर्फ स्कोर नहीं, बल्कि दक्षता को भी लीडरबोर्ड पर ट्रैक करने की योजना बनाई है

ARC Prize 2025: $1 मिलियन की प्रतियोगिता

ARC Prize 2025 इस सप्ताह Kaggle पर लॉन्च हो रहा है, जहां $1 मिलियन के इनाम रखे गए हैं। प्रतियोगिता का लक्ष्य ARC-AGI-2 चुनौतियों को प्रभावी ढंग से हल करने वाले सिस्टम को विकसित करना है

प्रमुख पुरस्कारों में शामिल हैं:

  • ग्रैंड प्राइज$700,000 (85% सफलता दर के साथ)
  • टॉप स्कोर प्राइज$75,000 (सबसे उच्च स्कोर वाले सबमिशन के लिए)
  • पेपर प्राइज$50,000 (ARC-AGI कार्यों के लिए नए विचारों पर शोध के लिए)
  • अतिरिक्त इनाम$175,000 (प्रतियोगिता के दौरान घोषित किए जाएंगे)

पिछले साल ARC Prize 2024 में 1,500 से अधिक टीमों ने भाग लिया, जिससे 40 प्रभावशाली शोध पत्र प्रकाशित हुए। इस साल बढ़े हुए इनाम नए विचारों और नवाचार को और भी ज्यादा प्रोत्साहित करने के लिए रखे गए हैं

ARC Prize का मानना है कि अगली बड़ी तकनीकी क्रांति सिर्फ मौजूदा सिस्टम को बढ़ाने से नहीं, बल्कि जटिलता को समझने और नवाचार को अपनाने से आएगी। यही वजह है कि यह प्रतियोगिता बड़े संगठनों के अलावा स्वतंत्र शोधकर्ताओं और प्रयोगशालाओं को भी भाग लेने के लिए प्रेरित कर रही है

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Leave a Reply

Your email address will not be published. Required fields are marked *

Next Post

फ्रैंकी वुडहेड - थ्राइव: क्यों न्यूरोडाइवर्स इनपुट AI विकास के लिए अनिवार्य है

AI भविष्य को आकार दे रहा है, लेकिन क्या यह वास्तव में सभी के लिए डिज़ाइन किया गया है? AI-संचालित […]