Glibc получает больше оптимизаций AVX-512 — примерно на 30% меньше циклов для некоторых строковых функций

В широко зависящей от GNU C библиотеке «glibc» был проведен еще один раунд оптимизации для тех, у кого есть процессоры AVX-512 от Intel, а теперь и для AMD с Zen 4.

Инженер Intel Сунил К. Пандей (Sunil K Pandey) представил улучшенные векторные расширения EVEX512 для функций memchr, rawmemchr и wmemchr для Glibc. Версии этих строковых функций для EVEX512 могут использовать на 30 % меньше циклов по сравнению со стандартными реализациями EVEX. Варианты функций memchr, rawmemchr и wmemchr в конечном итоге используются для поиска символа в блоке памяти. Преимущества использования 512-битного вектора зависят от длины строки и других факторов.

Тем временем сегодня в Glibc Git Ной Голдштейн внес ряд оптимизаций для существующих реализаций EVEX различных функций libc.

Приятно видеть продолжающуюся оптимизацию EVEX512 даже с последними клиентскими процессорами Intel, в которых отсутствует AVX-512, в то время как новые процессоры AMD Zen 4 могут похвастаться хорошей производительностью AVX-512.
Поделиться:

Похожие публикации

Тут ничего нет

Нет комментариев