Как нейросети совершают революцию в поисковиках

22 февраля 2023

Иллюстрация: Катя Эл
Искусственный интеллект с прошлого года не сходит с первых полос изданий, следящих за миром информационных технологий. Озадачив художников и дизайнеров, встревожив профессоров высших учебных заведений и копирайтеров, нейросети добрались до поисковых систем. Сразу два крупных IT-гиганта презентовали собственные чат-боты на основе машинного обучения – Microsoft и Google. И это событие наметило крупный сдвиг в том, как мы привыкли искать информацию в интернете. Редакция The Voice Media рассказывает о том, что происходит с нейросетями сейчас.
Успех нейросетей

Философы встревожены тем, что работы, написанные людьми, не отличить от тех, что пишет нейросеть. Кажется, копирайтерам и другим людям, работающим с текстом, пора задуматься о смене работы или научиться применять новый для себя инструмент. Апокалиптично звучат предположения, что если современные нейросети учатся на текстах, написанных человечеством, то вскоре объем текстов, написанных машинами, достигнет такой величины, что следующее поколение нейронок будет учиться уже на машинных текстах. Впрочем, чтобы избежать этого, предлагается маркировать машинные тексты особым способом.

Студенты пишут эссе, курсовые и дипломы с помощью нейронки.Одни уже высказываются за запрет использование нейронных сетей в учебном процессе. Однако на это разумно возражают другие: а может быть, пора менять подходы и методы современного образования? Если преподаватели или даже аттестационные комиссии не могут разобраться, где в итоговом тесте приложил руку студент, а где электронный разум, то, возможно, «не трубы надо менять, а систему», как говорится в старом анекдоте. Когда-то с таким же подозрением мы относились к появлению персональных компьютеров, интернета и поисковых систем. Но никто не запретил ни то, ни другое, ни третье. Все они стали удобными инструментами в руках студентов, учителей, ученых.

В то же время программисты восхищаются успехами другой системы машинного обучения — GitHub Copilot, в создании которого участвовал все тот же OpenAI (разработчик ChatGPT). Вы, наверное, удивитесь, но эта программа помогает разработчикам писать коды, причем на таких популярных языках программирования, как Python, JavaScript и Go. Недалек тот день, когда джунам нужно будет изучать не сам язык программирования, а искусно пользоваться нейронными сетями.

На этом этапе своего развития все нейронные сети объединяет то, что они умело компилируют имеющиеся массивы данных, пишут обобщенные тексты, но не могут создавать что-то новое, не могут по-настоящему творить. Поэтому представителям точных наук, где статьи пишутся на основе экспериментальных данных, точно можно не беспокоиться.
Новая революция в поиске

Когда находишься в центре какого-то события, почти невозможно оценить его масштабы. В 2004 году, то есть менее 20 лет назад, нельзя было посмотреть ролики на YouTube, в 2009 году нельзя было выложить сторис в инстаграме, а в 2012 году — почитать новости в телеграм-каналах. Их всех попросту еще не существовало, мы жили себе спокойно и пользовались mail.ru агентом. Сейчас же представить свою жизнь без этих сервисов практически невозможно.

Неслучайно, Билл Гейтс, который стоял у основания современной интернет-эпохи, очень высоко оценивает нейронные сети, в частности ChatGPT. «Это так же важно, как персональные компьютеры и интернет. Это будет обсуждаться, это самая горячая тема 2023 года», – говорил он в недавнем интервью. Все самые известные IT-бизнесмены мира уже включились в «нейронную» гонку.

OpenAI – это некоммерческая организация, один из основателей которой – Илон Маск (впрочем, он позже покинул компанию из-за разногласий). Несмотря на свою некоммерческую структуру, OpenAI запустила гигантские нейронные сети, для создания и обучения которых требовались суперкомпьютеры и немалые инвестиции. Инвестировала в компанию корпорация Microsoft, которая в этом году объявила, что продолжит вкладывать в машинное обучение и инвестирует в OpenAI еще 10 млрд долларов. Пожалуй, главная цель, которую преследует Microsoft — улучшение интернет-поиска.

Интернет-поиск долгое время оставался и остается вотчиной Google. Многие из наших читателей и не вспомнят такие поисковые системы, как Yahoo!, AltaVista и MSN Search, а ведь именно с ними начинало свою конкурентную борьбу детище Ларри Пейджа и Сергея Брина. Сейчас же поиск в интернете ассоциируется прежде всего с Google и только с ним. И это не преувеличение. Каждый может в реальном времени посмотреть, какую долю в поиске занимают разные поисковые компании: Google — 92%, Bing — 3%, на все остальные приходится меньше 5%. Совершенно логично, что при таких показателях Google закрепился даже в языке: гуглить — значит, что-то искать в интернете. Однако появление нейронных сетей похоже застало интернет-гиганта врасплох.
Главная страница поисковика Bing
Microsoft уже заявила, что будет «прикручивать» свою нейронную сеть, которая создана на основе ChatGPT, к поиску Bing. Тысячи, а может и десятки тысяч гиков, журналистов и интернет-аналитиков получили ранний доступ к бета-тестированию новой нейронной сети, точнее к чат-боту.

Что такое интернет-поиск сейчас? Вы заходите на главную страницу гугла, вбиваете в поисковой строке то, что вам нужно. Google вам выдает десятки страниц, которые и являются ответом на ваш запрос, которые перемежаются рекламой, совсем не релевантными страницами, а ответ вы должны искать, переходя от одной выданной странички к другой.

А теперь представьте, что вместо утомительного поиска вы вскоре будете просто разговаривать с чат-ботом, который вам будет сразу давать ответ, причем со всеми ссылками.
А что же Google?

Интернет-гигант поспешно запустил свой чат-бот Google Bard, чтобы не отставать от Microsoft. Однако в презентации, которую наверняка предварительно отсмотрели десятки топ-менеджеров компании, была допущена грубейшая ошибка, которую увидели все, кто следит за новостями аэрокосмической индустрии, ну а после этого журналисты поспешили приукрасить эту неудачу кликбейтными заголовками.

Тем не менее тот факт, что чат-бот от лидера интернет-поиска на простой вопрос рассказать о телескопе «Джеймс Уэбб» выдал неправильную информацию (что, мол, он сделал первые снимки экзопланет, хотя, на самом деле, это было сделано еще 17 лет назад), ярко дал понять: дела у Google в нейронной гонке совсем плохи. Если они не смогли подготовить Bard (к неймингу чат-бота тоже есть вопросы) даже для отшлифованной демонстрации, то что будет при запуске продукта для широкой аудитории. Согласитесь, что если мы будем гуглить ближайшее кафе или курс валют, то ожидаешь получить однозначный ответ. Видео с демонстрацией тут же сделали частным (то есть фактически недоступным пользователям Сети), но остановить реакцию было уже невозможно: акции корпорации немедленно рухнули на несколько процентов и даже сами сотрудники компании раскритиковали руководство за поспешное объявление о запуске Bard.
Meta, Apple и другие?

Пока от других IT-корпораций только либо оглушительное молчание (Apple пока ничего не анонсирует и не комментирует), либо неловкие заявления (один из топ-менеджеров Meta назвал ChatGPT «хорошо спроектированным, но не особо инновационным» продуктом).

Другие же поисковые компании – китайская Baidu, корейская Naver, российский Yandex, – уже спешат анонсировать свои сервисы на основе машинного обучения. Однако глядя на сложности Google, можно предположить, что Apple и Meta поступают вполне мудро, не пытаясь запрыгнуть в вагон в последнюю минуту. Похоже это как раз тот случай, когда семь раз отмерь и один раз отрежь.

Технооптимисты же считают, что в ИИ вкладываться нужно уже сейчас, потом будет уже поздно. Новости в ежедневном режиме сообщают о новых успехах нейросетей, графические дизайнеры переквалифицируются в операторов машинного обучения, а гугловский AlphaFold предсказывает пространственную структуру белка.

Ну и напоследок приведем цитату генерального директора одной из крупнейших hardware-компаний мира NVIDIA Дженсена Хуанга:
— Это настоящее чудо. То, что она не может делать сейчас, она научится делать завтра. Это сродни разработке iPhone, но в сфере искусственного интеллекта. Это одно из величайших достижений, которые когда-либо были сделаны для вычислений.