هوش مصنوعی اوپن ای آی از مدل قبلی بیشتر توهم می زند
به گزارش ما دیجیتال، اوپن ای آی اخیرا مدلهای هوش مصنوعی o۳ و o۴ مینی را عرضه نموده که از بسیاری جهات خارق العاده هستند. اما این مدلهای جدید همچنان گرفتار توهم هستند یا اطلاعاتی نادرستی عرضه می کنند.
به گزارش ما دیجیتال به نقل از تک کرانچ، در واقع این مدلها بیشتر از نسخه های قدیمی تر اوپن ای آی توهم دارند. به نظر می آید توهم یکی از بزرگترین و سخت ترین چالش های هوش مصنوعی است که حتی سیستم هایی با بهترین عملکرد هم با آن روبرو می شوند. از لحاظ تاریخی هر مدل جدید اندکی در قسمت کاهش توهم بهتر عمل کرده و این شاخص در مدلهای جدیدتر نسبت به قدیمی تر بهتر شده است. اما این امر در مورد o۳ و o۴ مینی صدق نمی نماید. طبق تست های داخلی اوپن ای آی o۳ و o۴ مینی که مدلهای استدلالی هم نامیده می شوند، بیشتر از مدلهای استدلالی پیشین(o۱، o۱mini و o۳mini) و همینطور مدلهای سنتی اوپن ای آی یعنی مدلهای غیراستدلالی مانند جی پی تی ۴o توهم دارند. اما نکته نگران کننده تر آن است که سازنده چت جی پی تی هم دلیل این امر را نمی داند. اوپن ای آی در گزارش فنی o۳ و o۴ مینی نوشته تحقیقات بیشتری برای درک آن که چرا با ارتقاء مدلهای استدلالی وضعیت توهم آنها بدتر می شود، ضروری است. این شرکت فناوری متوجه شد o۳ به ۳۳ درصد از سوالاتی که در PersonQA(بنچمارک شرکت برای اندازه گیری صحت دانش مدل در رابطه با افراد) پرسیده می شود، با توهم پاسخ می دهد. این رقم حدودا دو برابر توهم مدلهای استدلالی پیشین اوپن ای آی یعنی o۳ و o۴ مینی است که این شاخص در آنها به ترتیب ۱۶ و ۱۴.۸ درصد بود. o۴mini حتی در این بنچمارک عملکرد بدتری داشت و در ۴۸ درصد مواقع گرفتار توهم می شد. Transluce یک لابراتوار تحقیقات هوش مصنوعی غیرانتفاعی هم شواهدی از آن یافت که o۳ تمایل به ابداع اقداماتی در فرآیند پاسخ دادن به سوالات دارد. این موسسه در یک مثال متوجه شد o۳ کدی را در مک بوک پرو ۲۰۲۱ خارج از چت جی پی تی اجرا کرده و در مرحله بعد این اعداد در جواب سوالاتش کپی کرد. هرچند o۳ به برخی ابزارها دسترسی دارد، اما نمی تواند این کار را انجام دهد.
منبع: madigital.ir
این مطلب را می پسندید؟
(1)
(0)
تازه ترین مطالب مرتبط
نظرات بینندگان در مورد این مطلب