Работает на русском. Alibaba представила нейросеть Qwen3 ASR для расшифровки аудиозаписей в плохом качестве

Alibaba представила новую ИИ-модель Qwen3-ASR-Flash, предназначенную для расшифровки аудиозаписей.

По точности распознавания речи она превосходит такие модели, как Gemini-2.5-Pro и GPT-4o. Qwen способна расшифровывать любые аудио, включая песни и некачественные записи с сильным фоновым шумом.

Модель поддерживает 11 языков, в том числе русский и английский.

Qwen3-ASR-Flash можно протестировать бесплатно на HuggingFace и ModelScope. Разработчики также могут интегрировать её в свои сервисы. Стоимость расшифровки составляет $0,000032 за секунду аудио.

Что-то пошло не так

Мы в Telegram

Форум

Избранное

Теги: Новости

(ещё...)

Теги: Новости

(ещё...)

iPhones.ru

Alibaba представила новую ИИ-модель Qwen3-ASR-Flash, предназначенную для расшифровки аудиозаписей. По точности распознавания речи она превосходит такие модели, как Gemini-2.5-Pro и GPT-4o. Qwen способна расшифровывать любые аудио, включая песни и некачественные записи с сильным фоновым шумом. Модель поддерживает 11 языков, в том числе русский и английский. Qwen3-ASR-Flash можно протестировать бесплатно на HuggingFace и ModelScope. Разработчики также...

До ←
Чем отличается iPhone 17 от iPhone 16. Мы ждали это 4 года

Информация на этой странице взята из источника:

Темы и теги

Наука и Технологии

Alibaba расшифровка аудиозапись asr gpt-4 новый ии-модель ModelScope нейросеть язык русский

Работает на русском. Alibaba представила нейросеть Qwen3 ASR для расшифровки аудиозаписей в плохом качестве

Чем отличается iPhone 17 от iPhone 16. Мы ждали это 4 года

Темы и теги