Компания Google представила обновления для своих моделей искусственного интеллекта Gemini и анонсировала новую версию открытой модели Gemma. Разбираемся, что нового и классного в сфере ИИ ждет нас.

Кадр из фильма: «Из машины»

Среди ключевых нововведений – экспериментальный режим расширенного мышления чат-бота Deep Think для модели 2.5 Pro, которая превосходит разработку OpenAI от Илона Маска. Также значительное обновление получила модель Gemini 2.5 Flash, показывая лучшие результаты в логических задачах, работе с несколькими типами данных и генерации программного кода. При этом она требует на 20–30% меньше токенов для достижения того же результата, что делает ее более экономичной.

К слову, обе модели теперь оснащены новыми функциями работы со звуком. Например, появилась поддержка преобразования текста в речь с использованием нескольких вариантов голоса. Звуковой вывод способен передавать тонкие нюансы, такие как шепот или эмоциональную окраску, и поддерживать более 24 языков.

Также были представлены две новые функции, делающие голосовое взаимодействие более естественным: Affective Dialogue, которая позволяет модели распознавать эмоциональный тон пользователя и адаптировать свой ответ под настроение человека (нейтральный, грустный или веселый), и Proactive Audio, предназначенная для фильтрации фоновых разговоров, чтобы ИИ реагировал только на прямое обращение.

Кстати, пока Google продолжает набирать обороты и занимает лидерские позиции в топах, у OpenAl не все так гладко. Все дело в обновлении чата GPT, которое стало провальным из-за хейта пользователей.

Темы и теги

США Наука и Технологии

gemini Google языковой модель Илона Маска нейросеть обновление gemma openai