Glibc готовит еще одну серию оптимизаций для процессоров AVX-512
Буквально на прошлой неделе я писал о том, что Glibc готовит дополнительные оптимизации для процессоров AVX-512 с реализацией большего количества функций библиотеки C в версиях расширенного векторного расширения EVEX512. На этой неделе будет больше работы над функциями EVEX512.
Sunil Pandey реализовал версии EVEX512 символов strchrnul, strchr и wcschr в строковых функциях. Это следует за версиями memchr, rawmemchr и wmemchr для EVEX512, которые появились на прошлой неделе, и другими разработками AVX-512/EVEX512, которые появились в библиотеке GNU C за последние несколько лет.
Для ЦП AVX512VL + AVX512BW эти оптимизированные функции могут занимать на 30 % меньше циклов ЦП, чем стандартные пути AVX. Тем не менее, время для этой работы с AVX-512 хорошее, поскольку Zen 4 эффективно использует AVX-512 для процессоров AMD.
Последнюю работу функции EVEX512 для Glibc можно найти через этот коммит. Эти последние оптимизации производительности Glibc и другие усовершенствования станут частью Glibc 2.37, выпуск которого ожидается в феврале.
Sunil Pandey реализовал версии EVEX512 символов strchrnul, strchr и wcschr в строковых функциях. Это следует за версиями memchr, rawmemchr и wmemchr для EVEX512, которые появились на прошлой неделе, и другими разработками AVX-512/EVEX512, которые появились в библиотеке GNU C за последние несколько лет.
Для ЦП AVX512VL + AVX512BW эти оптимизированные функции могут занимать на 30 % меньше циклов ЦП, чем стандартные пути AVX. Тем не менее, время для этой работы с AVX-512 хорошее, поскольку Zen 4 эффективно использует AVX-512 для процессоров AMD.
Последнюю работу функции EVEX512 для Glibc можно найти через этот коммит. Эти последние оптимизации производительности Glibc и другие усовершенствования станут частью Glibc 2.37, выпуск которого ожидается в феврале.
Похожие публикации
Нет комментариев