Откуда ChatGPT берет свои ответы и как туда попасть: SEO-оптимизация нового поколения

Разобраться • 15 июля 2025

Откуда ChatGPT берет свои ответы и как туда попасть: SEO-оптимизация нового поколения

Откуда ChatGPT берет свои ответы и как туда попасть: SEO-оптимизация нового поколения

Текст: Григорий Щеглов

Фото: Unsplash


Поисковая оптимизация переживает революцию. Если раньше успех измерялся позициями в топ-10 Google, то теперь появилась новая цель — попасть в ответы искусственного интеллекта. ChatGPT, Perplexity, Claude и другие нейросети становятся новым интерфейсом для поиска информации, и миллионы пользователей уже предпочитают получать ответы от ИИ, а не листать страницы результатов поиска.

Но откуда ChatGPT знает, что отвечать на вопрос о тенденциях маркетинга или особенностях российского законодательства? Почему в одних случаях он ссылается на конкретные исследования, а в других дает общие рекомендации? И главное — как сделать, чтобы ваш контент попадал в эти ответы?

Поисковая оптимизация переживает революцию. Если раньше успех измерялся позициями в топ-10 Google, то теперь появилась новая цель — попасть в ответы искусственного интеллекта. ChatGPT, Perplexity, Claude и другие нейросети становятся новым интерфейсом для поиска информации, и миллионы пользователей уже предпочитают получать ответы от ИИ, а не листать страницы результатов поиска.

Но откуда ChatGPT знает, что отвечать на вопрос о тенденциях маркетинга или особенностях российского законодательства? Почему в одних случаях он ссылается на конкретные исследования, а в других дает общие рекомендации? И главное — как сделать, чтобы ваш контент попадал в эти ответы?

Как устроен ChatGPT и откуда он берет информацию

Языковые модели не «знают» фактов в традиционном понимании. Они не хранят информацию в виде базы данных, где по запросу «столица Франции» выдается «Париж». Вместо этого они понимают статистические закономерности в языке: после слов «столица Франции» в текстах чаще всего следует слово «Париж».

ChatGPT обучался на колоссальном массиве текстов, собранных в интернете до определенной даты. Это примерно середина 2023 года для GPT-4, март 2025 года для Claude 4 и июль 2024 года для DeepSeek. В этот корпус вошли статьи из Википедии на десятках языков, научные публикации, новостные сайты и блоги, книги и литература в открытом доступе и техническая документация. После первоначального этапа модель дорабатывали с помощью обучения с подкреплением от человека (RLHF).

Кирилл Пшинник

Кирилл Пшинник

CEO онлайн-университета Zerocoder

«В среднем ChatGPT и Claude получают обновленные базы только при выпуске новых моделей, то есть раз в три-шесть месяцев. Perplexity же работает как „движок реального времени“ на основе моделей Anthropic и OpenAI: при каждом запросе система обращается к актуальным источникам, постоянно обновляя свой индекс и предоставляя информацию в моменте».

Когда ChatGPT отвечает на вопрос о конкретной технологии, он не «вспоминает» статью, которую прочитал во время обучения. Вместо этого он генерирует ответ на основе паттернов, извлеченных из всех текстов на эту тему. Если сотни источников описывали одну и ту же технологию похожим образом, модель «усвоила» эту информацию как достоверную.

Этот принцип объясняет, почему ChatGPT может дать точный ответ о широко освещенной теме, но ошибиться в деталях малоизвестного события. Качество ответа напрямую зависит от того, насколько хорошо тема была представлена в корпусе обучения.

Пользователи все чаще воспринимают ChatGPT не просто как инструмент для решения конкретных задач, а как основной интерфейс для поиска информации, предпочитая его традиционным «Яндексу» и Google. Вместо того чтобы вводить ключевые слова и просматривать результаты, они задают вопросы естественным языком и получают структурированные ответы.

Елизавета Малышева

Елизавета Малышева

главный редактор Neuragency

«LLM-модели ведут себя больше как реальные люди — ищут то, что реально полезно. Поэтому поведение пользователей постепенно меняется. Все чаще люди начинают раздражаться от идеи гуглить вручную».

Для бизнеса это означает новую реальность: недостаточно просто попасть в топ Google. Теперь важно, чтобы ваш контент был частью того массива знаний, на котором базируются ответы ИИ. Это не замена традиционному SEO, а его логическое продолжение в эпоху искусственного интеллекта.

Как попасть в ответы

Попасть в ответы ChatGPT можно несколькими способами. Во-первых, можно стать частью данных, на которых обучалась модель. Это означает, что ваш контент должен быть общедоступным в интернете, индексируемым поисковыми системами и опубликованным до момента сбора данных для следующего этапа обучения.

Однако есть важный нюанс: даже если ваш контент был включен в корпус обучения, это не гарантирует, что он будет использован в ответах. Модель синтезирует информацию из множества источников, и ваши данные могут быть лишь одним из элементов этой сложной системы.

Более быстрый путь — оптимизация под browsing-функции современных моделей. Такие надстройки позволяют ChatGPT, DeepSeek и другим моделям обращаться к интернету в режиме реального времени. Это открывает возможности для SEO-оптимизации в привычном понимании: снова становятся важными позиции в поиске, структура сайта, скорость загрузки. Обучающие данные влияют на знания модели, но не на то, что она выдаст, если запрос требует свежей информации.

Помимо этого, API и плагины создают прямые каналы связи между ИИ и источниками данных. Компании могут предоставлять свои базы знаний напрямую, минуя традиционные поисковые системы. По такой схеме, например, в рамках специальных соглашений Reddit делится своим контентом с OpenAI и Google.

На что обратить внимание бизнесу

Кирилл Пшинник

CEO онлайн-университета Zerocoder

«Классическое SEO строится на технических и измеримых параметрах — от частоты ключевых слов и качества ссылок до скорости загрузки страниц. В свою очередь, оптимизация для нейросетей делает упор на пользовательском намерении — нейросеть распознает, что вы на самом деле ищете, даже если формулировки кажутся бессвязными; модель также оценивает не просто совпадения фраз, но и общий контекст и пользу текста».

Структурированность контента приобретает новое значение. Четкая иерархия информации, логические связи между разделами, использование заголовков и подзаголовков помогают модели лучше понимать и воспроизводить контент. Нейросети особенно чувствительны к противоречиям и неточностям — контент, который противоречит устоявшимся фактам, может быть проигнорирован или использован с меньшим весом.

Анализ того, как ChatGPT формирует ответы, показывает несколько четких закономерностей. Авторитетность источника играет решающую роль: контент с сайтов с высокой репутацией цитируется значительно чаще. Это включает не только доменную авторитетность, но и экспертность автора, наличие ссылок на первоисточники, упоминания в других авторитетных публикациях.

Полнота раскрытия темы — еще один ключевой критерий. Поверхностные статьи систематически проигрывают глубоким исследованиям. ИИ отдает предпочтение источникам, которые рассматривают вопрос всесторонне, предоставляют контекст и раскрывают нюансы. Как и в традиционном SEO, читабельность имеет значение: хорошо структурированный текст с четкими абзацами, подзаголовками и логичными переходами лучше воспринимается моделью.

Создание справочного контента показывает высокую эффективность. Статьи формата «полное руководство», FAQ, глоссарии имеют максимальные шансы попасть в ответы ИИ. Они структурированы, информативны и отвечают на конкретные вопросы, которые пользователи задают нейросетям.

Елизавета Малышева

главный редактор Neuragency

«Начинать оптимизацию под нейросети нужно уже сейчас. Потому что когда все начнут делать бизнес на готовых инструментах — стоить это будет дороже минимум в два раза. Но к тому времени нейросети уже обучатся на тех брендах, которые раньше обратили на это внимание. Чем плотнее у GPT ассоциация между запросом и брендом, тем сложнее эту связь разорвать. Особенно небольшим компаниям».

Для оценки эффективности оптимизации под LLM бизнес может использовать привычные инструменты. Как подчеркивает Елизавета Малышева, когда ChatGPT и Perplexity выдают ответ в виде ссылок, на них проставляются UTM-метки. Переходы в таком случае отображаются как отдельный источник в Google Analytics и «Яндекс Метрике».

Кирилл Пшинник

CEO онлайн-университета Zerocoder

«Нейросеть стоит рассматривать как навигатор в огромном море контента. Еще не так много компаний, понимающих силу и важность SEO в генеративном ИИ, но уже есть шанс получить конкурентное преимущество: пока одни пытаются перенастроить классическое SEO, у вас появляется шанс прокачать свои тексты под модели — иными словами, получить преимущество в выдаче и охвате».