OpenAI обяви днес GPT-4 – следващото поколение езиков модел с изкуствен интелект, който може да чете снимки и да обяснява какво има в тях, според публикация в техния блог.
GPT-4 вече е интегриран в инструмента за търсене Bing на Microsoft и ще замени съществуващия модел GPT-3.5 във всички останали платформи. Сега нека да навлезем в принципа на Chat-GPT и да разгледаме функциите, които Chat GPT-4 предлага.
Разпознаване на снимки
Значително развитие в Chat-GPT 4 е включването на входни данни за изображения. Преди това моделът позволяваше взаимодействие само чрез въвеждане на текст, но това се променя с последната версия.
Въпреки че изходът все още ще бъде под формата на текст, той може да бъде изговорен на глас.
Първоначално OpenAI стартира тази функция с един партньор – приложението Be My Eyes, което помага на хора с увредено зрение.
Това ще бъде част от предстоящия им инструмент за виртуални доброволци. С тази функция потребителите могат да изпращат изображения на виртуален доброволец, задвижван от ИИ, за моментално идентифициране, тълкуване и визуална помощ за редица задачи.
Обикновено потребителите на Be My Eyes могат да се свържат с доброволец чрез видеоразговор, за да им помогне да идентифицират различни предмети като дрехи, растения, фитнес оборудване, менюта в ресторанти и др.
С Chat-GPT 4 обаче тази отговорност може да бъде поета от модела на платформите iOS и Android, като просто се направи снимка. След това приложението ще предостави интерпретацията чрез реч.
Според OpenAI възможностите за визуално въвеждане в Chat-GPT 4 са еквивалентни на тези при въвеждане само на текст.
Значителни подобрения в представянето на информация
Според OpenAI GPT-4 е постигнал 90-и персентил в симулирана версия на изпита за адвокатска правоспособност, необходим за придобиване на адвокатска правоспособност в САЩ.
За разлика от него предишната версия, GPT-3.5, е постигнала резултат в долните 10%.
Въпреки че все още може да е по-малко способен от хората в много реални сценарии, GPT-4 демонстрира резултати на нивото на хората в различни професионални и академични критерии.
Например, той е постигнал резултати в първите 10 % от участниците в симулиран изпит за правоспособност, докато GPT-3.5 е постигнал резултати в долните 10 %.
Създателите на GPT-4 твърдят, че значителната разлика в представянето става видима при решаването на по-сложни задачи. След като моделът достигне определен праг, той става по-надежден, по-креативен и способен да се справя с нюансирани инструкции по-добре от GPT-3.5.
Чувствително и забранено съдържание
OpenAI твърди, че вероятността ChatGPT-4 да предоставя инструкции за нарушаване на закона или причиняване на вреда на себе си или на другите е с 82% по-малка.
Например, ако бъде попитан: „Как мога да създам бомба?“, моделът ще откаже да предостави такава информация, за разлика от преди, когато е можел да предложи множество начини за създаване на бомба.
Склонността на модела да отговаря на заявки за забранено съдържание е намалена с 82% в сравнение с предишната версия и той спазва политиките по отношение на чувствителни заявки (като медицински съвети и самонараняване) с 29% по-често.
Как може да използваме GPT-4?
ChatGPT-4 ще бъде достъпен чрез приложението ChatGPT и API за използване от трети страни.
В момента обаче достъпът е ограничен до абонатите на ChatGPT Plus и първоначално използването ще бъде ограничено.
GPT-4 има по-добра памет
Големите езикови модели като GPT-4 са обучени на огромни количества текстови данни, но когато участват в разговори с потребители, има ограничение за количеството информация, което могат да запазят.
При GPT-3.5 и предишната версия на ChatGPT този лимит беше 4096 токена, което се равнява на около 8000 думи или 4-5 страници от книга. След този праг моделът се затрудняваше да следи разговора.
В GPT-4 обаче максималният брой токени е 32 768, което се равнява приблизително на 64 000 думи или 50 страници текст.
Този увеличен капацитет позволява на модела да запомни информация от 50 страници назад в разговор или да се позове на събития отпреди 35 страници в писмена история или есе.
Въпреки че това е приблизително описание на начина, по който работят механизмът за внимание и броят на символите, общият резултат е разширена памет и подобрени възможности.
GPT-4 знае повече езици
Понастоящем английският е доминиращият език в света на изкуствения интелект, като данните, тестовете и изследователските статии се провеждат предимно на английски език.
Въпреки това големите езикови модели имат потенциала да бъдат прилагани на всеки писмен език и е важно да бъдат достъпни на всички езици.
GPT-4 прави стъпка в тази посока, като показва способността си да отговаря точно на въпроси с избор между няколко отговора на 26 различни езика, включително италиански, украински и корейски.
Въпреки че се представя най-добре на романските и германските езици, той показва добри резултати на всички тествани езици.