Сколько электричества тратит нейронка на один запрос, на 10 запросов в день и в месяц
Про искусственный интеллект часто пишут, что он потребляет чудовищно много энергии. В ход идут яркие сравнения вроде чайника, который «вскипает при каждом запросе», или телевизора, который «горит часами». В этих спорах смешивают разные вещи.
За последний год появились понятные оценки именно для одного обычного текстового запроса. Цифры позволяют сравнивать не впечатления, а реальность.
Мы собрали аккуратные прикидки в бытовых единицах и с простыми примерами, чтобы каждый мог быстро понять, стоит ли вообще беспокоиться на эту тему.
Ключевая цифра
Данные далее взяты из отчётов Google и OpenAI по расходам электроэнергии на работу нейросетей Gemini и ChatGPT.
Итак, один типичный текстовый запрос к крупной модели тратит примерно от 0,24 до 0,30 Вт-ч.
Это очень мало, сравните:
▪ микроволновка 1000 Вт, 1 секунда: 0,28 Вт-ч
▪ светодиодная лампа 9 Вт, 120 секунд: 0,30 Вт-ч
▪ зарядка смартфона 5 Вт, 180 секунд: 0,25 Вт-ч
▪ ноутбук 50 Вт, 20 секунд: 0,28 Вт·ч
Но что, если запросов будет много?
⚡️ Берём ориентир от 0,24 до 0,30 Вт·ч за один текстовый запрос.
📍 1 запрос: от 0,24 до 0,30 Вт-ч.
📍 10 запросов в день: от 2,4 до 3,0 Вт-ч.
📍 Месяц по 10 в день: примерно от 0,07 до 0,09 кВт-ч.
Если учитывать работу дата-центра целиком, то есть наличие охлаждения и вспомогательных систем, то можно прибавить сверху от 10 до 20 процентов.
Сколько это в деньгах. Умножьте месячные кВт-ч на цену за кВт-ч в вашем регионе. Для примера. 0,07–0,09 кВт-ч в месяц превращаются в меньше одного рубля при тарифе 8 руб. за кВт-ч.
Если делать 1 запрос в день, то получится 0,00024–0,00030 кВт-ч. При тарифе 8 рублей за кВт-ч это примерно 0,002–0,0024 рублей в день. То есть две десятые копейки.
А за месяц при 1 запросе в день получается около 0,06–0,07 рублей в месяц. Это шесть–семь копеек.
Когда расход электричества на запрос вырастает
► Когда пишете длинные промпты и очень объёмные ответы. Больше текста означает больше вычислений, всё просто.
► Выбираете сложные режимы ИИ. Картинки, видео и аудио всегда «тяжелее» чистого текста, для них требуется больше мощностей, соответственно, и энергии тоже нужно больше.
► Используете менее эффективные площадки. Частные компании не могут соперничать с гигантами рынка ИИ в этом плане. У первых выше накладные расходы на охлаждение и электрику, поэтому потребление энергии получается больше.
Для обычной переписки этот нюанс почти не заметен. Ориентир остаётся тем же: от 0,24 до 0,30 Вт-ч за текстовый запрос.
Почему тогда так много страшилок про это
Чаще всего в одном разговоре смешивают обучение и ответы на вопросы пользователей. Обучение действительно тянет большие мощности серверов и звучит пугающе.
Вторая причина связана с ранними грубыми оценками нейросетей старого типа и отдельными тяжёлыми запросами, которые не отражают повседневную работу людей с нейронками.
Есть и споры о методиках. Например, как учитывать воду на охлаждение и как считать углеродный след. Для человека, который просто задаёт вопросы, важен порядок величины в реализации «спросил и получил ответ». Здесь цифры стабильно невелики, в чём вы уже убедились.
Можно ли как-то повлиять на расход энергии
Если хотите сократить свой углеродный след (и доверяете «зелёной» пропаганде западных энергетических компаний), то:
Считать расход просто. Для текста берите от 0,24 до 0,30 Вт-ч на запрос. Если хотите подстраховаться, прибавьте от 10 до 20 процентов на инфраструктуру.
Например, один абзац текста – это от пятидесяти до ста двадцати слов. Они укладываются укладывается в диапазон 0,24–0,30 Вт-ч.
Формулируйте запрос точнее. Короткие и понятные запросы экономят и время, и токены, и энергию
Держите контекст разумным. Не подгружайте лишние вложения и длинные фрагменты без необходимости.
Вывод
Один текстовый запрос к нейросети потребляет десятки сотых ватт-часа. Даже если задавать по десять вопросов в день, за месяц набегают десятые доли киловатт-часа и символические деньги.
Важно помнить про масштаб. На уровне одного человека экономия получается не на уровне счёта за свет, за счёт разумного использования. Чёткая формулировка, умеренная длина контекста и понимание того, что повседневный инференс — это крошечная доля киловатт-часа, а не «чайник на каждую мысль».
Так что пользуйтесь нейронками спокойно. Развернуть дома на личном ПК локальную нейросеть более-менее приличного уровня будет всё равно гораздо «дороже», чем пользоваться облачной, где всё оптимизировано по-максимуму.
