Новиот модел, наречен OpenAI o1, може да ги реши проблемите со кои се мачат постоечките модели со вештачка интелигенција, вклучувајќи го и најмоќниот постоечки модел на OpenAI, GPT-4o. Наместо да го собере одговорот во еден чекор, како што вообичаено прави големиот јазичен модел, тој резонира низ проблемот, ефективно размислувајќи гласно како што би правел некој човек, пред да дојде до вистинскиот резултат.
„Ова е она што го сметаме за новата парадигма во овие модели“, изјави за WIRED Мира Мурати, главна технолошка директорка на OpenAI. „Многу е подобро во справувањето со многу сложени задачи за расудување“.
Новиот модел имал кодно име „јагодка“ во рамките на OpenAI, и тој не е наследник на GPT-4o, туку надополнување на него, велат од компанијата.
Мурати вели дека OpenAI моментално го гради својот следен главен модел, GPT-5, кој ќе биде значително поголем од неговиот претходник. Но, додека компанијата сè уште верува дека зголемувањето на моделот ќе помогне да се исфрлат нови способности од вештачката интелигенција, GPT-5 најверојатно ќе ја вклучи и технологијата за расудување воведена денес. „Постојат две парадигми“, вели Мурати. „Парадигмата на зголемување и оваа нова парадигма. Очекуваме дека ќе ги комбинираме“.
Големите јазични модели обично ги составуваат своите одговори од огромни невронски мрежи кои се хранат со огромни количини на податоци за обука. Тие можат да покажат извонредни јазични и логички способности, но традиционално се борат со изненадувачки едноставни проблеми како што се елементарни математички прашања кои вклучуваат расудување.
Мурати вели дека OpenAI o1 користи засилено учење, што вклучува давање на моделот позитивен фидбек кога генерира правилни одговори и негативни повратни информации кога не го прави тоа, со цел да го подобри неговиот процес на расудување. „Моделот го изострува своето размислување и фино ги прилагодува стратегиите што ги користи за да дојде до одговорот“, вели таа. Засилено учење им овозможи на компјутерите да играат игри со натчовечка вештина и да вршат корисни задачи како дизајнирање компјутерски чипови. Техниката е исто така клучна состојка за претворање на јазичните модели во корисен и добро воспитан чатбот.
„Новиот модел учи да размислува сам за себе, наместо да се обидува да го имитира начинот на кој луѓето би размислувале како што тоа го прави конвенционален јазичен модел“ вели Марк Чен, потпретседател за истражувања во OpenAI.
OpenAI вели дека неговиот нов модел има значително подобри перформанси на голем број проблеми, вклучувајќи ги и оние фокусирани на кодирање, математика, физика, биологија и хемија. На Американскиот математички испит со покани (AIME), тест за студенти по математика, GPT-4o во просек решил 12 проценти од проблемите, додека o1 решил 83 проценти правилно, според компанијата.
Новиот модел е побавен од GPT-4o, а OpenAI вели дека не секогаш функционира подобро – делумно затоа што, за разлика од GPT-4o, не може да пребарува на интернет и не е мултимодален, што значи дека не може да анализира слики или аудио.
Техниката воведена од OpenAI вчера, исто така, може да помогне да се осигура дека моделите со вештачка интелигенција се однесуваат добро. Мурати вели дека новиот модел се покажал како подобар во избегнувањето на генерирањето на непријатен или потенцијално штетен резултат со резонирање за исходот од неговите постапки. „Ако размислувате да ги научите децата, тие учат многу подобро да се усогласат со одредени норми, однесувања и вредности откако ќе можат да расудат зошто прават одредена работа“, вели таа.
Извор: Wired