در یک رقابت پیشبینی اقتصادی، ChatGPT توانست عملکردی قابل توجه از خود نشان دهد. این مسابقه که به سرپرستی دیوید سیف برگزار شد، به بررسی توانایی هوش مصنوعی در پیشبینی آینده پرداخت و نتایج آن نشان داد که ChatGPT در حد میانگین شرکتکنندگان عمل کرده است.
این رقابت، هفتمین دوره خود را تجربه کرد و از شرکتکنندگان خواسته شد تا احتمال وقوع حدود ۳۰ رویداد در حوزههای مختلف را پیشبینی کنند. سم لفل، مدیر یک صندوق سرمایهگذاری، برای پاسخ به سوالات از ChatGPT استفاده کرد. این مدل هوش مصنوعی به سرعت به سوالات پاسخ داد و نتایجی ارائه داد که گاهی بر اساس محاسبات آماری بود.
در این مسابقه ۱۶۰ شرکتکننده حضور داشتند و امتیازها با توجه به فاصله پیشبینیها از نتایج واقعی بهروزرسانی میشد. در پایان، ChatGPT رتبه ۸۰ را کسب کرد و برخی این نتیجه را نشانه ضعف و برخی دیگر نشانه توانمندی مدل دانستند.
دیوید سیف به معیار دیگری اشاره کرد و گفت که اگر پیشبینیها بهطور تصادفی با احتمال ۵۰ درصد انتخاب میشد، امتیاز ۷۵ هزار بهدست میآمد، در حالی که امتیاز ChatGPT حدود ۸۲,۹۲۵ بود که نشاندهنده ارزش افزوده منفی است.
عملکرد ChatGPT در رویدادهایی که سوابق کافی داشتند بهتر بود، اما در مواردی که نیاز به اطلاعات جدید بود، عملکرد ضعیفتری داشت. لفل معتقد است که این نتیجه باید با توجه به پیشرفتهای اخیر ChatGPT مورد بررسی قرار گیرد و در دنیای سرمایهگذاری، استفاده از ابزارهای هوش مصنوعی به یک امر عادی تبدیل شده است.
