Journal influence
Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)
Bookmark
Next issue
№3
Publication date:
16 September 2025
An experimental study of the performance impact of jemalloc memory profiler on execution time of multithreaded applications
Date of submission article: 12.01.2015
UDC: 004.4`6
The article was published in issue no. № 2, 2015 [ pp. 55-59 ]Abstract:This paper examines the performance impact of jemalloc memory profiler on execution time of multithreaded applications. Using popular synthetic tests the authors implemented a multithreaded application which allows varying different parameters related to memory allocation. A special criteria is suggested to com-pare and estimate profiling results. Tbricks algorithmic trading system is used to demonstrate that popular syn-thetic tests are not adequate enough to analyze memory profiling impact on operational characteristics of the ap-plication. Studies have shown that inactive profiling doesn’t affect the characteristics while with active profiling its values depend on sampling interval and can decrease manyfo ld. According to our analyses of jemalloc library source code related to memory profiling, the part which takes stacktraces is the main reason of extra overhead during profiling. Thus, we compare performance impact on operational characteristics of the app lication using libunwind and prof-libgcc stacktrace libraries: results of experiments made with libunwind stacktrace library are in average 20 % worse than with prof-libgcc. Based on experimental study we recommend using sampling inte r-val which allows of capturing information of at least 90 % of all allocated memory, while execution time of highly multithreaded applications decreases by less than 5 % in comparison with the disabled profiling. This al-lows analyzing memory allocations of applications while executing in production environment.
Аннотация:Для проведения экспериментов на основе популярных синтетических тестов реализовано многопоточное приложение, позволяющее варьировать различные параметры, связанные с выделением памяти. Предложен критерий для оценки результатов профилирования памяти. На примере системы алгоритмической торговли Tbricks показано, что синтетические тесты не обладают достаточной степенью адекватности для анализа влияния профилирования памяти на характеристики оперативности реального приложения. Установлено, что неактивное профилирование не влияет на рассматриваемые характеристики, в то время как при активном профилировании наблюдаемые значения зависят от интервала выборки и могут ухудшаться в несколько раз. Проведен анализ исходного кода библиотеки jemalloc, отве-чающего за профилирование памяти, что помогло определить сбор стеков как основную причину накладных расхо-дов при профилировании. Выполнено сравнение рассматриваемых характеристик оперативности при использовании библиотек для сбора стеков libunwind и prof-libgcc: результаты экспериментов, выполненных с использованием би б-лиотеки для сбора стеков libunwind, в среднем на 20 % хуже, чем при использовании библиотеки prof-libgcc. На ос-нове проведенных экспериментов авторами рекомендован интервал выборки, при котором результаты профилирова-ния содержат информацию не менее чем о 90 % всей выделенной памяти. При этом увеличение времени выполнения приложения с высокой степенью параллелизма составляет порядка 5 % по сравнению с отключенным профилированием, что позволяет анализировать выделение памяти в приложениях в процессе их работы в промышленных условиях.
Authors: Ivanov E.Yu. ( i@eivanov.com, eiva@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Toropov A.V. (tav@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Kosyakov M.S. (mkosyakov@gmail.com, mkosyakov@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Ph.D | |
Keywords: sampling interval, stacktrace, jemalloc, multithreading, operational characteristics, profiling, memory |
|
Page views: 12103 |
Print version Full issue in PDF (4.84Mb) Download the cover in PDF (0.35Мб) |
Исследование влияния профилирования памяти средствами библиотеки jemalloc на время выполнения многопоточных приложений
DOI: 10.15827/0236-235X.110.055-059
Date of submission article: 12.01.2015
UDC: 004.4`6
The article was published in issue no. № 2, 2015. [ pp. 55-59 ]
This paper examines the performance impact of jemalloc memory profiler on execution time of
multithreaded applications. Using popular synthetic tests the authors implemented a multithreaded application
which allows varying different parameters related to memory allocation. A special criteria is suggested to com-pare and estimate profiling results. Tbricks algorithmic trading system is used to demonstrate that popular syn-thetic tests are not adequate enough to analyze memory profiling impact on operational characteristics of the ap-plication. Studies have shown that inactive profiling doesn’t affect the characteristics while with active profiling
its values depend on sampling interval and can decrease manyfo ld. According to our analyses of jemalloc library
source code related to memory profiling, the part which takes stacktraces is the main reason of extra overhead
during profiling. Thus, we compare performance impact on operational characteristics of the app lication using
libunwind and prof-libgcc stacktrace libraries: results of experiments made with libunwind stacktrace library are
in average 20 % worse than with prof-libgcc. Based on experimental study we recommend using sampling inte r-val which allows of capturing information of at least 90 % of all allocated memory, while execution time of
highly multithreaded applications decreases by less than 5 % in comparison with the disabled profiling. This al-lows analyzing memory allocations of applications while executing in production environment.
Ivanov E.Yu. ( i@eivanov.com, eiva@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Toropov A.V. (tav@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Kosyakov M.S. (mkosyakov@gmail.com, mkosyakov@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Ph.D
Ссылка скопирована!
Permanent link: http://swsys.ru/index.php?page=article&id=3998&lang=&lang=en&like=1 |
Print version Full issue in PDF (4.84Mb) Download the cover in PDF (0.35Мб) |
The article was published in issue no. № 2, 2015 [ pp. 55-59 ] |
The article was published in issue no. № 2, 2015. [ pp. 55-59 ]
Perhaps, you might be interested in the following articles of similar topics:Perhaps, you might be interested in the following articles of similar topics:
- Репрезентативность метрик на основе событий процессора Intel Sandy Bridge при анализе времени обработки данных в памяти
- Сравнительный анализ реализаций спин-блокировок
- Сетевые и многопоточные аспекты архитектуры распределенных СУБД
- Генератор текста программ в исходном виде для систем реального времени
Back to the list of articles