OpenAI שחררה שני דגמים חדשים, o1-preview ו-o1-mini, שם הקוד שלהם הוא "strawberry", המציעים יכולות שיפור בהסקת מסקנות באמצעות דפוס של שרשרת מחשבה.
מודלים אלה שמורים לחשבונות ברמה 5 ($1,000+ בקרדיטים של API) ומציגים "אסימוני נימוק" המחויבים אך אינם נראים בתגובת ה-API, מה שמעורר אי שביעות רצון מסוימת בשל חוסר השקיפות.
״הדגמים החדשים יכולים להתמודד טוב יותר עם הנחיות מורכבות ויש להם הקצאות מוגברות של אסימוני פלט, מה שמרחיב את המשימות הפוטנציאליות שניתן לפתור באמצעות מודלים גדולים של שפה (LLMs).״
מודלי שרשרת המחשבה החדשים של OpenAI מסוג o1 עדיין מייצרים הזיות, כגון ספריות ופונקציות שאינן קיימות, ולעיתים קרובות מספקים עובדות שגויות.
משתמשים מבחינים שבעוד שהיכולות ההגיוניות השתפרו, המודלים עדיין אינם מצליחים לאמת את הדיוק העובדתי של התוצרים שלהם, מה שמחייב את המשתמשים לבדוק שוב.
ישנם משתמשים שמשווים את המודלים למתמחים נאיביים אך אינטליגנטיים, ומציעים שהם יכולים להיות שימושיים עם הכוונה נכונה, אם כי הם חסרים את היכולת לשאול שאלות הבהרה או להודות בחוסר ודאות, מה שמשפיע על האמינות שלהם.