С его сверхъестественными способностями вести беседу, отвечать на вопросы и писать связную прозу, стихи и код, чат-бот ChatGPT заставил многих людей переосмыслить потенциал искусственного интеллекта .
Стартап, создавший ChatGPT, OpenAI , сегодня объявил о долгожданной новой версии модели ИИ в её основе.
Новый алгоритм под названием GPT-4 следует за GPT-3, революционной моделью генерации текста, которую OpenAI анонсировала в 2020 году , которая позже была адаптирована для создания ChatGPT в прошлом году.
По словам OpenAI, новая модель получает более высокие оценки в ряде тестов, предназначенных для измерения интеллекта и знаний людей и машин. Он также делает меньше ошибок и может реагировать как на изображения, так и на текст.
Тем не менее, нейросеть GPT-4 страдает от тех же проблем, которые преследуют ChatGPT и заставляют некоторых экспертов по ИИ скептически относиться к его полезности, включая склонность «галлюцинировать» неправильную информацию, демонстрировать проблемные социальные предубеждения и плохо себя вести.
«Хотя они добились значительного прогресса, они явно не заслуживают доверия», — говорит Орен Этциони, почётный профессор Вашингтонского университета и генеральный директор-основатель Allen Institute for AI . «Пройдёт много времени, прежде чем вы захотите, чтобы какой-либо GPT управлял вашей атомной электростанцией».
OpenAI предоставил несколько демонстраций и данные тестов производительности, чтобы продемонстрировать возможности GPT-4. Новая модель может не только превзойти проходной балл на Едином экзамене на адвоката, который используется для квалификации юристов во многих штатах США, но и попасть в 10 процентов лучших людей.
Он также набирает более высокие баллы, чем GPT-3, на других экзаменах, предназначенных для проверки знаний и рассуждений по таким предметам, как биология, история искусств и исчисление. И он получает более высокие оценки, чем любая другая языковая модель ИИ, в тестах, разработанных для оценки прогресса. «В некотором смысле это одно и то же, — говорит Этциони. «Но это больше похоже на совершенно умопомрачительную серию достижений».
GPT-4 также может выполнять изящные трюки, которые ранее использовались в GPT-3 и ChatGPT, например, подводить итоги и предлагать изменения для фрагментов текста. Он также может делать то, чего не могли его предшественники, в том числе выступать в роли сократовского наставника, который помогает студентам находить правильные ответы и обсуждать содержание фотографий. Например, если предоставить фотографию ингредиентов на кухонном столе, GPT-4 может предложить подходящий рецепт. Если она снабжена диаграммой, она может объяснить выводы, которые можно сделать из нее.
«Кажется, он определенно приобрёл некоторые способности», — говорит Винсент Конитцер , профессор CMU, который специализируется на искусственном интеллекте и начал экспериментировать с новой языковой моделью. Но он говорит, что он все ещё допускает ошибки, например, предлагает бессмысленные указания или представляет фальшивые математические доказательства.
ChatGPT привлёк внимание общественности потрясающей способностью решать множество сложных вопросов и задач с помощью простого в использовании диалогового интерфейса. Чат-бот не понимает мир так, как люди, и просто отвечает словами, которые, по его статистическим данным, должны следовать за вопросом.
Но этот базовый механизм также означает, что ChatGPT и подобные ему системы часто придумывают факты. И, несмотря на усилия OpenAI, направленные на то, чтобы сделать модель устойчивой к злоупотреблениям, её можно спровоцировать на неправильное поведение, например, предложив ей разыграть то, что она отказывается делать, когда её об этом просят напрямую. OpenAI говорит, что GPT-4 на 40% чаще даёт «фактические ответы», и говорит, что GPT-4 на 82% реже отвечает на запросы, которые следует запретить. Компания не сообщила, как часто предыдущая версия, GPT-3, даёт фактически неверные ответы или отвечает на запросы, которые она должна отклонить.
Тем не менее, Илья Суцкевер, соучредитель и главный научный сотрудник OpenAI, считает это, пожалуй, самым значительным достижением новой модели. «То, что мешает ChatGPT быть действительно полезным для многих людей, — это надёжность», — говорит он. «GPT-4 ещё нет, но он намного ближе».
Конитцер из CMU говорит, что GPT-4, по-видимому, включает в себя новые ограничения, которые не позволяют ему генерировать нежелательные ответы, но добавляет, что его новые возможности могут привести к новым способам его использования.
Появление GPT-4 давно ожидалось в технических кругах, в том числе с активным созданием мемов о потенциальных возможностях невыпущенного программного обеспечения.
Вдохновившись потенциалом ChatGPT, в январе этого года Microsoft инвестировала 10 миллиардов долларов в OpenAI. В следующем месяце компания продемонстрировала обновление своей поисковой системы Bing, которая использует ChatGPT для сопоставления информации и ответов на сложные вопросы. В прошлом году Microsoft выпустила инструмент кодирования, который использует GPT для автозаполнения фрагментов кода для программиста.
Шумиха вокруг чат-бота также вызвала интерес к новым стартапам, создающим или использующим аналогичные технологии искусственного интеллекта, и заставила некоторые компании чувствовать себя не в своей тарелке. Google , который годами инвестировал в исследования ИИ и изобрёл некоторые из ключевых алгоритмов, используемых для создания GPT и ChatGPT, изо всех сил пытается наверстать упущенное. Исследовательский документ OpenAI по GPT-4 раскрывает несколько подробностей о том, как GPT-4 был построен или как он работает, ссылаясь на конкуренцию вокруг этих новых инструментов ИИ, а также на риски, которые они представляют.
На этой неделе Google анонсировала API и новые инструменты разработчика для собственной модели генерации текста под названием PaLM, которая работает аналогично GPT OpenAI. Google также тестирует чат-бота для конкуренции с ChatGPT под названием Bard и заявил, что будет использовать базовую технологию для улучшения поиска.
OpenAI сообщает, что версия ChatGPT, использующая GPT-4, доступна для платных пользователей чат-бота, и компания постепенно сделает новую языковую модель доступной через свой API.
Возможности ChatGPT и подобных программ искусственного интеллекта вызвали споры о том, как искусственный интеллект может автоматизировать или революционизировать некоторые виды офисной работы . Более продвинутые итерации могут получить новые навыки. Тем не менее, Этциони стремится подчеркнуть, что, хотя GPT-4 впечатляет, все еще есть бесчисленное множество вещей, которые люди считают само собой разумеющимися, но которые он не может сделать. «Мы должны помнить, что, каким бы красноречивым ни был ChatGPT, это всего лишь чат-бот», — говорит он.
Перевод и адаптация статьи https://www.wired.com/story/gpt-4-openai-will-make-chatgpt-smarter-but-wont-fix-its-flaws/