Лаборатория исследований искусственного интеллекта Yandex Research совместно с НИУ ВШЭ, MIT, KAUST и ISTA разработала метод быстрого сжатия больших языковых моделей (LLM) без потери качества.

Techinsider