2026-03-06 02:29:19

GPT-5.4 випущено, майбутній напрямок ітерацій штучного інтелекту стає ясним. На даний момент у галузі AI вже відбувається перехід від діалогових вікон до еволюції системних інтелектуальних агентів: люди відповідають за естетику, AI — за реалізацію, рухаючись у напрямку спільної роботи людини і машини.

➤ Основні оновлення GPT-5.4
1、Об’єднання універсального логічного мислення GPT-5.2 з передовими програмістськими можливостями GPT-5.3-Codex
2、Підтримка вікна на 100000 токенів (приблизно 5000 сторінок документів), вирішення проблеми забування довгих текстів
3、Нативна робота з комп’ютером: модель може безпосередньо дивитись на екран, керувати мишею, набирати на клавіатурі. У тестах OSWorld успіх склав 75.0%, що вже перевищує середній рівень людини
4、Введення функції переривання під час роботи. Діалог більше не є статичним по колу, користувач може в будь-який момент вставити нові вимоги під час обдумування або відповіді моделі
5、Оптимізація ефективності та вартості, введення механізму Tool Search. Модель більше не потребує попереднього завантаження всіх визначень інструментів, а шукає їх за потреби, що значно економить 47% споживання токенів.
➤ Чому так?
Зараз провідні світові лабораторії AI стикаються з «стінкою даних». До 2026 року, ймовірно, весь високоякісний текст, код і книги, створені людством, будуть зібрані великими моделями у масштабі. Навчання на текстах досягло межі, такі системи, як Claude code, codex, openclaw, глибоко інтегровані з сучасними операційними системами, замінюючи частину операцій і викликаючи системні інструменти, маючи автономне усвідомлення для виконання завдань.
Ще одна річ, яку багато хто не знає: серія моделей codex тренується разом із фреймворком Codex, тобто серії моделей codex і фреймворк Codex є нативно взаємопов’язаними, і модель може природно викликати всі інструменти розробки, що є у codex.
➤ Глибокий аналіз напрямків розвитку майбутнього AI
1. Від API-склеювання до нативної роботи на рівні операційної системи
Можливості Computer Use, продемонстровані GPT-5.4, виходять за межі діалогового вікна і охоплюють всю операційну систему.
Раніше модель писала код лише у обмеженому Sandbox (пісочниці), тепер вона матиме фізичні руки. Вона не лише розуміє логіку коду, а й здатна сприймати візуальні зворотні зв’язки від натискань, перетягувань, повідомлень про помилки у терміналі.
Новий рівень фреймворку більше не буде набором заздалегідь визначених функцій, а глибоким розумінням ОС. Під час тренування модель навчається спостерігати за екраном і давати зворотний зв’язок, що дозволяє їй, як досвідченому інженеру, одночасно редагувати код і переглядати UI у браузері, реалізуючи самовідтворювану розробку від кінця до кінця, вже реалізовану у codex.
2. Мільйонний контекст + архітектура довготривалих завдань + система пам’яті = універсальний архітектор
У трирівневій архітектурі Codex модель забезпечує структуроване логічне мислення. 100000 токенів контексту, які приносить GPT-5.4, фактично створюють широку полотно для такого мислення.
Система пам’яті OpenAI залишається лідером, з виходом беззбиткової та безмежної пам’яті. Особливо, коли модель і фреймворк є нативно взаємопов’язаними, модель може миттєво отримати доступ до всього коду (мільйонний рівень токенів), а фреймворк — точно застосувати зміни до десятків пов’язаних файлів.
Зараз у codex вже можливо повністю переписати архітектуру і точно розуміти значення коду.
3. Пошук і динамічне розширення інструментів
Механізм Tool Search, введений у GPT-5.4, дозволяє фреймворку розуміти вихідні дані моделі, отримуючи більше контексту для точних дій.
Майбутній напрям — не попереднє завантаження тисяч інструментів (щоб уникнути марнотратства токенів), а у реальному часі при потребі викликати визначення та завантажувати їх через Tool Search. Це означає, що навички, які зараз є, можуть бути лише проміжним етапом, а більшість інструментів будуть інтегровані у модель, і модель сама обиратиме, який інструмент викликати.
Перевага — збереження високої ефективності токенів. Це вирішує парадокс, коли більше інструментів робить модель меншою. Це дозволяє агентам мати необмежне дерево навичок, автоматично оптимізуючи і знаходячи найкращий шлях для подальшого тренування нових поколінь моделей.
4. Реальний час взаємодії, перехід від поетапних діалогів до можливості переривати і змінювати в будь-який момент
Введена функція переривання у GPT-5.4 руйнує чорний ящик AI, дозволяючи коригувати хід роботи, якщо щось йде не так.
На рівні співпраці більше залучаються людські рішення, а не повністю автономна робота AI, що забезпечує прозору співпрацю: люди відповідають за естетику, визначення потреб, вибір рішень, а AI — за реалізацію.
Завдяки цій функції реального втручання AI перестає бути «лотереєю» для одноразових завдань і стає партнером у проектуванні, здатним змінювати вимоги у процесі.
Просте розуміння нового режиму AI Native (Codex + GPT-5.4): з нуля створити F1 болід, де двигун, шасі, шини — з самого початку проектуються для максимальної швидкості і працюють у гармонії.
Майбутнє — це не пошук більш потужних моделей, а інтеграція з системами розробки на глибшому рівні.

Переглянути оригінал

Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.