پژوهش جدید محققان مؤسسه فناوری ماساچوست (MIT) نشان میدهد که هوش مصنوعی اساساً درکی از الگوهای پیچیده جهان ندارد.
مؤسسه فناوری ماساچوست در سکوت خبری ضربه سنگینی به بزرگترین شرکتهای هوش مصنوعی جهان وارد کرد. پژوهشگران این دانشگاه بنچمارکی جدید به نام WorldTest طراحی کردهاند تا مشخص شود آیا مدلهای هوش مصنوعی واقعاً «درکی» از جهان دارند یا صرفاً الگوها را تقلید میکنند؛ نتایج این آزمایش ناامیدکننده بود. حتی قدرتمندترین مدلها از جمله Claude، Gemini ۲.۵ Pro و OpenAI o۳ در این آزمایش در برابر عملکرد انسانها شکست خوردند.
برخلاف آزمونهای متداول که توانایی مدلها را در پیشبینی کلمه یا فریم بعدی میسنجند، WorldTest بررسی میکند که آیا هوش مصنوعی میتواند مدلی درونی از واقعیت بسازد و از آن برای واکنش به موقعیتهای تازه استفاده کند یا خیر. پژوهشگران MIT برای این منظور AutumnBench را طراحی کردند؛ مجموعهای شامل ۴۳ دنیای تعاملی و ۱۲۹ وظیفه متفاوت که در آن مدلها باید بتوانند:
– بخشهای پنهان محیط را پیشبینی کنند
– برای رسیدن به اهداف، برنامهریزی چندمرحلهای انجام دهند
– تشخیص دهند چه زمانی قوانین محیط تغییر کردهاند
در این مطالعه، ۵۱۷ شرکتکننده انسانی در کنار پیشرفتهترین مدلهای هوش مصنوعی آزمایش شدند. نتیجه روشن بود: انسانها در تمام دستهها برتری کامل داشتند و افزایش توان پردازشی مدلها تأثیر چشمگیری در عملکردشان نداشت.
نتیجه اصلی این تحقیق تکاندهنده است؛ مدلهای امروزی در واقع محیط را «درک» نمیکنند، بلکه تنها درون آن الگوها را تطبیق میدهند. برخلاف انسانها، این مدلها قادر به انجام کارهایی مثل کاوش، اصلاح باورها یا آزمایش فرضیهها نیستند.
به گفته تیم MIT، WorldTest شاید نخستین بنچمارکی باشد که بهجای حافظه، «فهم واقعی» را میسنجد. شکافی که این آزمایش آشکار کرده، میتواند بزرگترین چالش بعدی در مسیر درک شناختی هوش مصنوعی باشد.
