Journal influence
Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)
Bookmark
Next issue
№2
Publication date:
16 June 2024
Representativeness of Intel Sandy Bridge performance counters based metrics for memory access latency analysis
Date of submission article: 29.06.2015
UDC: 004.074
The article was published in issue no. № 4, 2015 [ pp. 198-202 ]Abstract:This paper examines the representativeness of metrics based on Intel Sandy Bridge performance event counters and memory access latencies for data processed in RAM. It contains detailed overview and analyses of frequently used metrics recommended by Intel documentation. The authors have implemented a synthetic test application, which allows measuring memory access latencies for serial, per-page and random memory accesses and different sizes of working set and its elements processed by test application. The paper describes an approach to access performance event counters based on Linux perf utility. The test presented memory access latencies and calculated metrics based on performance event counters. The experimental studies showed that CPI, SCPI and PSRC metrics recommended by Intel and cache-miss ratio with serial memory access have linear dependency with measured memory latencies. Besides, the metrics values change proportionally to the change of memory latencies with the coefficient close to one. The random access results showed that most efficient metric for performance is the number of cycles wasted on bus waiting for data, because it always has high representativeness of memory access latencies and does not depend on data location. According to authors’ analyses, this metric is the most useful to evaluate memory access performance optimization efficiency. The results showed that the metrics considered in this paper can be used to analyze memory characteristics of application, which process data in RAM.
Аннотация:В данной работе выполнена оценка репрезентативности метрик на основе событий процессора Intel Sandy Bridge при анализе времени обработки данных в памяти. Приведены детальный обзор и анализ наиболее часто используемых при профилировании метрик, рекомендованных в документации Intel. Разработан синтетический тест, позволяющий измерить временные задержки при последовательном, случайном и постраничном доступах к памяти, различных размерах всего рабочего множества и отдельных его элементов, обрабатываемых тестовым приложением. Описан способ профилирования и получения числа событий процессора, основанный на использовании утилиты perf ОС Linux. С помощью теста получены временные характеристики работы с оперативной памятью и рассчитаны метрики на основе событий процессора. Экспериментально установлено, что при последовательном доступе к данным зависимость рекомендованных компанией Intel метрик CPI, SCPI, PSRC и частоты кэш-промахов от измеренных временных задержек имеет линейный характер. Кроме того, изменение данных метрик пропорционально изменению времени с коэффициентом, близким к единице. На основе полученных результатов для случайного доступа к памяти показано, что наиболее эффективной метрикой является число тактов, затраченных на ожидание шины данных, так как данная метрика хорошо описывает временные задержки в работе приложений, выполняющих обработку данных вне зависимости от их расположения в памяти. По мнению авторов, указанная метрика наиболее удобна для оценки эффективности оптимизации работы приложения с оперативной памятью. На основе полученных результатов показано, что рассматриваемые в работе метрики являются репрезентативными и могут быть использованы при анализе временных характеристик приложений, обрабатывающих данные в оперативной памяти компьютера.
Authors: Ivanov E.Yu. ( i@eivanov.com, eiva@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Kosyakov M.S. (mkosyakov@gmail.com, mkosyakov@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Ph.D | |
Keywords: intel sandy bridge, cache-memory, speed, optimisation, profiling, memory access, memory access latencies, event processor, performance event counters |
|
Page views: 13846 |
Print version Full issue in PDF (9.58Mb) Download the cover in PDF (1.29Мб) |
Репрезентативность метрик на основе событий процессора Intel Sandy Bridge при анализе времени обработки данных в памяти
DOI: 10.15827/0236-235X.112.198-202
Date of submission article: 29.06.2015
UDC: 004.074
The article was published in issue no. № 4, 2015. [ pp. 198-202 ]
This paper examines the representativeness of metrics based on Intel Sandy Bridge performance event counters and memory access latencies for data processed in RAM. It contains detailed overview and analyses of frequently used metrics recommended by Intel documentation. The authors have implemented a synthetic test application, which allows measuring memory access latencies for serial, per-page and random memory accesses and different sizes of working set and its elements processed by test application. The paper describes an approach to access performance event counters based on Linux perf utility. The test presented memory access latencies and calculated metrics based on performance event counters. The experimental studies showed that CPI, SCPI and PSRC metrics recommended by Intel and cache-miss ratio with serial memory access have linear dependency with measured memory latencies. Besides, the metrics values change proportionally to the change of memory latencies with the coefficient close to one. The random access results showed that most efficient metric for performance is the number of cycles wasted on bus waiting for data, because it always has high representativeness of memory access latencies and does not depend on data location. According to authors’ analyses, this metric is the most useful to evaluate memory access performance optimization efficiency. The results showed that the metrics considered in this paper can be used to analyze memory characteristics of application, which process data in RAM.
Ivanov E.Yu. ( i@eivanov.com, eiva@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Kosyakov M.S. (mkosyakov@gmail.com, mkosyakov@tbricks.com) - The National Research University of Information Technologies, Mechanics and Optics, Tbricks AB, St. Petersburg, Russia, Ph.D
Ссылка скопирована!
Permanent link: http://swsys.ru/index.php?page=article&id=4090&lang=&like=1&lang=en |
Print version Full issue in PDF (9.58Mb) Download the cover in PDF (1.29Мб) |
The article was published in issue no. № 4, 2015 [ pp. 198-202 ] |
The article was published in issue no. № 4, 2015. [ pp. 198-202 ]
Perhaps, you might be interested in the following articles of similar topics:Perhaps, you might be interested in the following articles of similar topics:
- Векторизация трехмерного метода погруженных границ для повышения эффективности расчетов на микропроцессорах Intel
- Оптимизация процессов в сверхкритическом реакторе
- Общие принципы системной оптимизации технологии контроля качества телерадиопродукции
- Интеллектуальное управление многосвязными объектами, реализованное в ситуационных подпрограммах
- Формирование мультимодельной системы для принятия оптимальных управленческих решений на предприятии
Back to the list of articles