Разреженность на Скорость: Новый Подход к Ускорению Больших Языковых Моделей
![SlideSparse расширяет возможности разреженных тензорных ядер 2:4 до семейства разреженности (2N-2):2N, преобразуя веса 6:8 в блоки, совместимые с 2:4, и достигая на A100 (INT8, seq\_len==8K) ускорения, приближающегося к теоретическому пределу [latex]S_{\max} = N/(N-1)[/latex], такому как 3/2, 4/3, 5/4.](https://arxiv.org/html/2603.05232v1/2603.05232v1/x1.png)
Исследователи разработали инновационную технику, позволяющую значительно ускорить обработку больших языковых моделей на современных графических процессорах за счет оптимизации разреженных вычислений.

![Наблюдения за моделью Келлера-Сегеля [latex] (2.33) [/latex] демонстрируют разнообразные пространственно-временные паттерны развития в зависимости от конечного времени симуляции, что указывает на чувствительность системы к начальным условиям и временным рамкам.](https://arxiv.org/html/2603.04931v1/2603.04931v1/x12.png)