Google VS чат-боты. Как ChatGPT и другие стартапы переосмысливают онлайн-поиск в эпоху ИИ
Новый ИИ-инструмент от OpenAI ChatGPT предлагает потенциальную новую модель для онлайн поиска: чат-бот с легкостью отвечает на сложные вопросы (будь то политология или компьютерное программирование), сразу предоставляя подробные ответы. Пользователи, которые ищут информацию в Google, наоборот должны детально просканировать страницы с результатами, пока не найдут необходимый им вариант.
Google долгое время был фактически неприкосновенным в сфере поиска, но несколько стартапов (некоторые основаны бывшими работниками Google) считают, что это со временем изменится. Они говорят, что уже сейчас происходит переход от поиска по ключевым словам к поиску на основе больших языковых моделей, анализирующих огромные текстовые базы данных, чтобы развить способность понимать вопросы пользователей и давать прямые ответы. Это как раз та технология, которую ChatGPT использует для быстрого ответа.
ChatGPT — новый чатбот OpenAI — настолько хорош, что может легко обманывать людей
Некоторые из технологических прорывов, лежащих в основе крупных языковых моделей, созданы в собственных исследовательских лабораториях Google. Но работники, которые уволились в последние годы и основали собственные стартапы или присоединились к другим, говорят, что компании может быть трудно использовать потенциал технологии. В основном из-за того, что ее бизнес-модель, в которой реклама отображается рядом с результатами поиска, слишком прибыльна, чтобы ее разрушать.
Google получил 54,48 млрд долларов дохода от рекламы в последнем квартале, что составляет 78,9% валовых продаж. Поисковая реклама была самой большой движущей силой для этого.
«Google — всего лишь жертва собственного успеха», — говорит Шридхар Рамасвами, бывший топ-менеджер Google по рекламе, который сейчас является исполнительным директором поисковой системы Neeva.
Впрочем, большие языковые модели имеют собственные недостатки. ChatGPT, например, может предоставить неточную информацию, которая будет выглядеть убедительно, а также не указывает источников, откуда данные получены. Google в свою очередь может направлять пользователей на сайты, которые распространяют дезинформацию, но предоставлять фейк как единственный правильный вариант – это принципиально другое и более рискованное дело.
В заявлении OpenAI сказано, что ChatGPT не включает данные из Интернета в свои ответы, а текущая версия работает на стадии тестирования — чтобы в дальнейшем разработать модели, которые являются «безопаснее, надежнее и полезнее».
Google в 1998 году представил свою поисковую систему Google, работающую на основе фирменного алгоритма PageRank, измеряющего важность каждого веб-сайта по тому, как часто другие сайты ссылаются на него. Инструмент быстро стал доминировать среди других схожих ресурсов и с разнообразием запросов и результатов, которые Google Поиск мог предоставить, ничто не могло сравниться. ChatGPT, напротив, учится на наборе данных, содержащем ограниченную до 2021 года информацию.
В последние годы Google добавил новые возможности: например поиск через камеру смартфона по изображению или комбинированный поиск (текст + изображение). Компания использует большие языковые модели для понимания запросов, а также включила эту технологию в свои «избранные фрагменты», показывающие ключевую информацию на страницах результатов поиска.
Google, у которого есть доступ к большому количеству данных и вычислительным ресурсам, кажется, имеет все необходимое для выполнения передовой работы с ИИ. Однако работающие там инженеры часто стремятся двигаться быстрее, поэтому компания сталкивается с оттоком этих кадров. В 2017 году специалисты Google опубликовали статью «Внимание — это все, что вам нужно», где представили концепцию систем, помогающих моделям ИИ сосредотачиваться на важнейших частях информации в данных, которые они анализируют. Обзор профилей LinkedIn показывает, что из восьми авторов статьи все кроме одного перешли к другим стартапам, а по крайней мере пять основали собственные ИИ-предприятия.
Пол Буххейт, бывший сотрудник Google, создавший Gmail, написал в серии сообщений в Twitter, что компания находится «за год или два до полного краха».
Google may be only a year or two away from total disruption. AI will eliminate the Search Engine Result Page, which is where they make most of their money.
Even if they catch up on AI, they can’t fully deploy it without destroying the most valuable part of their business! https://t.co/jtq25LXdkj
— Paul Buchheit (@paultoo) December 1, 2022
Приблизительно две трети поисковых запросов в Google завершаются без перехода на сайты, согласно исследованиям компании SparkToro и аналитической компании Similarweb. Это означает, что компании, возможно, просто нужно немного перенастроить свой пользовательский интерфейс.
Многолетний успех Google не останавливает стартапы от попыток превзойти поискового гиганта. Surge AI – платформа для маркировки данных, работающая с поисковыми стартапами – провела исследование, показавшее, что пользователи часто предпочитают результаты поиска от новых компаний, таких как Neeva, You.com и Kagi, особенно для таких запросов, как, например рецепты.
Поисковые стартапы приняли разные бизнес-модели. Vectara продает свое программное обеспечение компаниям, позволяя им предлагать на своих веб-сайтах поиск на основе больших языковых моделей. Kagi и Neeva за ежемесячную плату предлагают неограниченный поиск для обычных пользователей. Такие стратегии как дистилляция, в которой исходные данные большой языковой модели фильтруются через меньшую модель, позволили Neeva эффективно использовать свои вычислительные ресурсы.
Шридхар Рамасвами говорит, что все еще видит большое значение в устаревшей модели поиска, отметив, что, то, как вебсайты ссылаются друг на друга, все еще может многое рассказать об авторитетности источника. Neeva уже ввела большие языковые модели в свою поисковую систему и впоследствии планирует использовать их для разработки «одностраничных результатов», раскрывающих источники, чтобы пользователи могли самостоятельно оценить их достоверность.
Character.AI – еще один продукт бывших сотрудников Google (которые, кстати, работали над LaMDA). В сентябре стартап представил сайт с разными персонажами чатботов, с которыми пользователи могут общаться в реальном времени. На сайте опубликовано предупреждение — «Помните: все, что говорят персонажи — вымысел!», что может оправдать неточные данные, предоставленные чатами.
Google продолжает совершенствовать свой собственный чатбот LaMDA, впервые анонсированный в мае 2021 года, а также другие собственные большие языковые модели. Но есть убедительные аргументы, которые смогут заставить компанию ускориться — то, насколько быстро учатся другие ИИ-чатботы.
Источник: Bloomberg