Поисковый бот, с которым вы общаетесь, может упростить поиск ответов, если он не выдумывает или просто врёт.
ЦЗЯН ЧЕН, Эксперт по машинному обучению , ранее работавший в Google , был очарован, когда впервые попробовал ChatGPT, удивительно связного и, казалось бы, хорошо информированного чат-бота от OpenAI, ставшего интернет-сенсацией.
Но аура силы этой технологии померкла, когда Чен попытался использовать ту же базовую технологию искусственного интеллекта, чтобы создать лучший инструмент поиска для стартапа Moveworks , который он основал.
Компания использует ИИ, чтобы помочь сотрудникам просеивать информацию, такую как документы технической поддержки и страницы отдела кадров. Новый поисковый инструмент Чена с искусственным интеллектом отлично извлекал из таких документов всевозможную полезную информацию, включая адреса и номера телефонов, но некоторые из них не были реальными.
«Его способность генерировать ложь просто удивительна», — говорит Чен
Лихорадочный ажиотаж вокруг нейросети ChatGPT и широко распространённые предположения о том, что он может заново изобрести поисковые системы, понятны. Чат-бот может давать сложные и изощренные ответы на вопросы, синтезируя информацию, содержащуюся в миллиардах слов, извлеченных из Интернета и других источников, для обучения своих алгоритмов. Работа с ботом может дать ощущение более плавного взаимодействия с машинами.
Но то, как работает эта технология, в некотором роде принципиально противоречит идее поисковой системы, которая надёжно извлекает информацию, найденную в Интернете. В Интернете уже есть много неточной информации, но ChatGPT легко генерирует новые ложные сведения. Его базовые алгоритмы не извлекают данные из базы данных фактов или ссылок, а вместо этого генерируют строки слов, которые должны быть статистически похожими на те, которые можно увидеть в его обучающих данных, без учёта истины.
Несмотря на эту проблему и, возможно, благодаря головокружению вокруг ChatGPT, титаны веб-поиска, а также несколько стартапов устремляются вперёд на поиски решения. Говорят , что Microsoft, вложившая около 10 миллиардов долларов в создателя ChatGPT OpenAI, каким -то образом добавит базовую технологию в свой второй поисковик Bing .
Сообщается, что Google, который некоторое время работал над аналогичным чат-ботом под названием LaMDA, изо всех сил пытается ответить. Вскоре компания планирует выпустить версию LaMDA и в этом году может продемонстрировать до 20 продуктов , использующих ту же технологию. Ведущая поисковая система Китая Baidu работает над ботом на китайском языке, похожим на ChatGPT .
Пока технологические гиганты готовят свои ответы на ChatGPT, несколько стартапов запустили поисковые системы с интерфейсами чата, похожими на бот. Среди них You.com , Perplexity AI и Neeva .
Созданные ими инструменты иллюстрируют как потенциал, так и сложность адаптации технологии в стиле ChatGPT для поиска. You.com, основанный Ричардом Сочером, экспертом в области языка и искусственного интеллекта, может предоставлять ответы через интерфейс чата. Ответы сопровождаются цитатами, которые могут помочь пользователю отследить происхождение части информации.
Но модель иногда объединяет источники, которые не принадлежат друг другу. Например, на вопрос о человеке можно получить ответ, сочетающий информацию из биографий нескольких людей с одним и тем же именем. Когда меня спросили обо мне, You Chat точно описал мою роль в «Тест Тьюринга», но также приписал мне то, что я был бегуном в Университете Делавэра и профессиональным креативщиком.
Ещё одна проблема с такой системой, как ChatGPT, заключается в том, что её ответы основаны только на данных, на которых она обучалась. Полное переобучение модели может стоить миллионы долларов из-за её размера и масштаба данных. YouChat смущается, когда его спрашивают о последних спортивных результатах, но он знает, какая сейчас погода в Нью-Йорке.
«Я думаю, что сейчас многие из этих интерфейсов чата в некоторых отношениях намного превосходят возможности поиска, но в других они явно намного хуже», — говорит Сочер. «Мы работаем над сокращением всех этих проблем».
Аравинд Шринивас, основатель и генеральный директор поискового стартапа Perplexity AI, который ранее работал в OpenAI, говорит, что задача обновления системы, подобной ChatGPT, с помощью последней информации означает, что их необходимо объединить с чем-то ещё. «В одиночку они никогда не смогут быть хорошими поисковыми системами», — говорит он.
Саам Мотамеди, венчурный капиталист из Greylock Partners, который инвестировал в поисковую компанию Neeva, основанную на искусственном интеллекте, говорит, что также неясно, насколько совместимы интерфейсы чата с основной моделью дохода для поисковых систем — рекламой. Google и Bing используют поисковые запросы для выбора объявлений, которые появляются в верхней части списка ссылок, отображаемых в ответ. Мотамеди подозревает, что для жизнеспособности поисковых интерфейсов в стиле чата может потребоваться появление новых форм рекламы, но пока не совсем ясно, какими они будут. Neeva взимает абонентскую плату за неограниченный поиск без рекламы.
Стоимость запуска такой модели, как ChatGPT, в масштабах Google также может оказаться проблематичной. Луис Сезе, соучредитель и генеральный директор OctoML , компании, которая помогает компаниям снизить затраты на развёртывание алгоритмов машинного обучения, считает, что запуск поиска ChatGPT может быть в 10 раз дороже, чем поиск Google, потому что каждый ответ требует запуска большого и сложная модель ИИ.
Масштабы мании ChatGPT застали врасплох некоторых программистов и исследователей ИИ, знакомых с базовой технологией. Алгоритм, лежащий в основе бота, называемый GPT, был впервые разработан OpenAI в 2018 году , а более мощная версия GPT-2 была представлена в 2019 году . Это модель машинного обучения , предназначенная для обработки текста и последующего прогнозирования того, что будет дальше. OpenAI показала, что может работать впечатляюще, если обучаться с огромными объёмами текста. Первая коммерческая версия технологии, GPT-3, доступна разработчикам для использования с июня 2020 года и может выполнять многие из задач, за которые недавно прославилась нейросеть ChatGPT.
ChatGPT использует улучшенную версию базового алгоритма, но самый большой скачок в его возможностях связан с тем, что OpenAI позволяет людям предоставлять системе обратную связь. Но, как и предыдущие системы генерации текста, ChatGPT по-прежнему склонен воспроизводить предубеждения и ложь из своих обучающих данных , а также «галлюцинировать» правдоподобные, но неверные результаты .
Гэри Маркус, почётный профессор Нью-Йоркского университета и ярый критик ажиотажа вокруг ИИ, считает, что ChatGPT не подходит для поиска, потому что у него нет истинного понимания того, что он говорит. Он добавляет, что такие инструменты, как ChatGPT, могут создавать другие проблемы для поисковых компаний, наводняя Интернет текстом, созданным искусственным интеллектом и оптимизированным для поисковых систем . «Все поисковые системы вот-вот столкнутся с проблемой, — говорит он.
Алекс Ратнер , доцент Вашингтонского университета и соучредитель компании Snorkel AI , которая более эффективно работает над обучением моделей ИИ, называет ChatGPT «законным перегибом» того, что может делать программное обеспечение. Но он также говорит, что может потребоваться некоторое время, чтобы выяснить, как предотвратить создание языковых моделей, таких как GPT. Он считает, что поиск способа держать их в курсе новой информации для поддержания актуальности поиска, скорее всего, потребует новых подходов к обучению базовых моделей ИИ.
Сколько времени потребуется, чтобы эти исправления были изобретены и проверены, неясно. Может пройти некоторое время, прежде чем технология сможет радикально изменить то, как люди ищут ответы, даже если появятся другие варианты использования, такие как придумывание новых рецептов или помощь в учебе или программировании . «Это потрясающе, и я сказал своей команде, что люди будут воспринимать годы как до и после ChatGPT, — говорит Чен из Moveworks. «Но заменит ли это поиск — другой вопрос».