شرکت OpenAI سری جدید هوش مصنوعی خود را معرفی کرد که از توانایی استدلال برای حل مسائل پیچیده بهره برده و نتایجی نزدیک به هوش مصنوعی عمومی (AGI) ارائه میکند.
این خانواده هوش مصنوعی که O3 نام دارد، شامل دو مدل O3 و O3 مینی است که دومی برای انجام سریع برخی وظایف خاص طراحی شده است.
به گفته «سم آلتمن»، مدیرعامل OpenAI این مدلها آغازگر عصر جدیدی در توسعه هوش مصنوعی هستند و به لطف «استدلال پیشرفته» وظایف بسیار پیچیدهتری را انجام میدهند.
مدل o3 با مهارت استدلال چندمرحلهای، درست مانند یک انسان متفکر هر مسالهای را با دقت و ظرافت از جوانب مختلف بررسی میکند. این مدل برخلاف هوش مصنوعی محدود فعلی، از روش یادگیری تقویتی بهره میبرد؛ به این معنا که قبل از ارائه هر پاسخ مسئله را به بخشهای کوچکتر تقسیم کرده و به تحلیل دقیق آن میپردازد.
یکی از قابلیتهای کلیدی O3 امکان تنظیم سرعت پاسخدهی است. کاربران میتوانند بسته به نیاز خود، بین حالتهای سریع برای وظایف ساده یا حالت دقیق برای مسائل پیچیدهتر یکی را انتخاب کنند.
البته این دقت بالا به معنای زمان پردازش طولانیتر است. در برخی موارد ارائه پاسخ توسط O3 ممکن است چند دقیقه زمان ببرد. با این حال این تاخیر اندک بهویژه در حوزههایی مانند ریاضیات و علوم پیچیده، به ارائه نتایج بسیار دقیقتر منجر میشود.
هوش مصنوعی o3 در مقایسه با نسخه قبلی یعنی o1، در آزمونهای کدنویسی پیشرفته، حل مسائل علمی پیچیده و حتی آزمون منحصربهفردی مانند ARC-AGI عملکرد خیره کنندهای داشته است.
این مدل در آزمون کدنویسی SWE-Bench امتیاز ۷۱ درصد را کسب کرده در حالی که نمره مدل قبلی از ۴۸.۹ درصد فراتر نرفته بود. مدل جدید در یکی از دشوارترین آزمونهای ریاضی به نام EpochAI Frontier Math هم توانسته به امتیاز ۲۵.۲ درصد دست یابد، در حالی که سایر مدلهای هوش مصنوعی بهندرت از مرز ۲ درصد عبور کردهاند.
آنچه که بیشتر در مورد این هوش مصنوعی خبرساز شده موفقیت آن در آزمون ARC-AGI است. در این آزمون مدلها باید با مسائلی روبهرو شوند که هوش مصنوعی همواره در آنها چالش داشته چون نیاز به استدلال مستقیم دارند. مدل O3 در این آزمون سخت با عملکردی بسیار بهتر از رقبای خود امتیاز چشمگیر ۸۷.۵ را کسب کرده است.
در حال حاضر مدلهای o3 و o3 مینی تنها برای محققان و از طریق برنامه آزمایش امنیت OpenAI در دسترس قرار دارند. طبق اعلام شرکت نسخه مینی تا پایان ژانویه ۲۰۲۵ عرضه شده و نسخه کامل o3 نیز پس از تکمیل دوره آزمایشی منتشر خواهد شد.
یونس مرادی