Специалисты «Яндекса» разработали решение, позволяющее бизнесу сократить расходы на внедрение нейросетей до восьми раз
Команда Yandex Research совместно с исследователями IST Austria и Kaust разработала и опубликовала в свободном доступе новые методы сжатия больших языковых моделей. По словам разработчиков, эти методы позволяют сократить бизнесу расходы на вычислительные ресурсы до восьми раз.