Journal influence
Bookmark
Next issue
Neutral networks and regression models in S&P 500 index forecasting
The article was published in issue no. № 4, 2012 [ pp. 90-96 ]Abstract:The article presents a comparative analysis of neural network modeling and regression analysis for forecasting the S&P 500 index. Initially, the forecast of the absolute value of the index is provided, then we justify the use of stationery data, that is, the return of S&P 500. The comparison of two methods is carried out in two stages. Firstly methods are compared by the coefficient of determination on the periods of three and twelve months, and by the quality of trend predictions. Note that the choice of model and its testing is performed at different time intervals (the so-called in-sample and out-of-sample periods). Taking into account the fact that the primary desire of a typical trader is to gain a profit at the second stage we have chosen such trading criteria as profit and profit, weighted on risk (drawdown). On a longer time interval (12 months) regression shows the best results, but in terms of economic gains neural network win. When we consider a shorter period (3 months) neural network has better results. Thus, neural networks are able to assess the dynamics of the stock due to its flexibility and ability to find non-linear patterns.
Аннотация:В статье проводится сравнительный анализ нейросетевого моделирования и регрессионного анализа для целей прогнозирования индекса S&P 500. Изначально строится прогноз абсолютного значения индекса, обосновывается необходимость использования стационарных данных, то есть доходности S&P 500. Сравнение методов прогнозирования осуществляется в два этапа. Сначала методы сравниваются по коэффициенту детерминации за 3 и 12 месяцев и качеству предсказания тренда доходности. Отметим, что выбор модели и ее тестирование производятся на разных временных промежутках (так называемых периодах in-sample и out-of-sample). Исходя из того, что первостепенным желанием трейдера является извлечение прибыли, на втором этапе выбираются такие трейдинговые критерии, как прибыль и прибыль, взвешенная на риск, мерой которого является дродаун. На более длинном временном промежутке (12 месяцев) лучшую доходность показала факторная регрессия, однако по показателю экономической прибыли выиграла нейросеть. При рассмотрении более короткого промежутка (3 месяца) нейросеть опередила факторную и авторегрессию по обоим сравниваемым показателям. Таким образом, нейросети хорошо подходят для оценки биржевой динамики за счет своей гибкости и умения находить нелинейные закономерности.
Authors: (oskolkovama@gmail.com) - , Russia, (parshakov.petr@gmail.com) - , Russia | |
Keywords: artificial intellect, index yield forecasting, s&p 500, neural network modeling |
|
Page views: 13141 |
Print version Full issue in PDF (9.63Mb) Download the cover in PDF (1.26Мб) |
Биржевое ценообразование является наиболее эффективным способом распределения ограниченных ресурсов, в частности капитала. Поэтому ценообразование на финансовых рынках представляется актуальным направлением изучения как учеными-фундаменталистами, так и трейдерами. И если первых интересуют механизмы функционирования финансовых рынков, то цель вторых – получение прибыли путем прогнозирования цены акций либо их доходности. Наиболее популярным методом прогнозирования среди трейдеров является технический анализ, однако он описывает поведение финансового инструмента в ближайшем будущем и не объясняет причины изменения цен. Для стабильного извлечения прибыли в долгосрочном периоде необходимы иные статистические инструменты, позволяющие найти экономические закономерности, сохраняющиеся долгое время. В последние десятилетия для этих целей используется регрессионный аппарат, существенными недостатками которого являются выявление только линейных закономерностей и необходимость сбора данных за длительные промежутки времени, что в России в принципе невозможно. (Отметим, что регрессионный аппарат позволяет строить и нелинейные модели, однако вид функции, спецификацию модели необходимо выбрать до оценки параметров.) От этих недостатков избавлены методы искусственного интеллекта [1], которые, однако, мало применяются для прогнозирования цены и доходности акций. Кроме того, остается дискуссионным вопрос о сопоставлении преимуществ и недостатков этих двух математических аппаратов. В статье проводится сравнительный анализ эффективности методов нейросетевого моделирования и регрессионного анализа для прогнозирования цены и доходности акций. Каждый из них позволяет выявлять закономерности между изменениями цены и различными факторами, а также использовать саму цену в качестве единственного фактора. Первые исследования, посвященные изучению методов прогнозирования и построению предсказательных моделей биржевой динамики, появились еще в 20-х годах прошлого века. Для решения поставленной выше задачи интересны работы, которые одновременно рассматривают различные методики прогнозирования. Нейронные сети практически не применяются в данной области, однако следует отметить работы Алана Тиммерманна [2], который для целей прогнозирования использовал и регрессии, и нейронные сети. При этом в его работе были применены только двухслойные нейронные сети с неизменяющейся структурой слоев, в то время как параметры регрессий менялись. Кроме того, выбранные им методики не тестировались на одном временном промежутке, что не позволяет проводить сравнительный анализ рассмотренных методов. Целью же настоящей статьи является именно сравнение двух методов, которые тестируются на различных по длительности промежутках. Однако длина промежутков в целях корректности эксперимента выбирается одинаковой для обеих моделей. Кратко опишем объект исследования. Индекс S&P 500 включает 500 компаний – лидеров ведущих отраслей американской экономики и пользуется широким признанием во всем мире как лучший индикатор состояния фондового рынка США. Индекс ориентирован на сегмент рынка с высокой капитализацией, охватывая более 80 % акций американских компаний, что делает его идеальным инструментом, характеризующим состояние рынка в целом. Индекс принадлежит компании Standard & Poor's и ею же составляется. Для построения моделей авторы использовали месячные данные о величине индекса с 1965 года, так как с того времени стала широко применяться модель САРМ для объяснения рыночной динамики, что сильно повлияло на ценообразование финансовых инструментов. Использование месячных данных объясняется необходимостью соблюдения баланса между наличием достаточного количества наблюдений для построения значимой регрессии и неслучайностью колебаний цен внутри выбранного временного промежутка. Например, дневные данные о колебаниях цен (Intra-Day) практически случайны, тогда как за месяц происходит большое число событий, создающих корреляции между ценами различных периодов, таких как выпуск отчетов, новости экономики и политики и т.д. Чтобы рассмотреть поведение выбранных методик на разных по протяженности временных промежутках, тестирование проводилось на различных периодах обучения и построения регрессий: 1965–2006, 1990–2006, 2000–2006, 2003–2006. В качестве экзогенных факторов (табл. 1) были выбраны переменные, использованные в работе Гояла, Уэлша [3], посвященной исследованию динамики индекса S&P 500 и обосновывающей применение этих переменных для объяснения динамики фондового рынка. Таблица 1 Экзогенные переменные
Результаты рассмотренных вариантов прогнозирования приведены в таблице 2, содержащей реальные значения индекса и его оценки. В случае построения регрессий использовался метод наименьших квадратов. Кроме того, при работе с реальными статистическими данными важно проверить, действительно ли желаемые ограничения (условия, определяющие классическую линейную регрессионную модель) имеют место. Поэтому все регрессионные модели были проверены на гетероскедастичность (тест Парка), автокорреляцию остатков (авторегрессия первого порядка) и на нормальность ошибок модели (тест Жака–Бера). Кроме того, следует отметить, что построенные модели тестировались не на той выборке, на которой были построены, так как важнее не то, как модель объясняет закономерности на этой выборке (так называемый in-sample, IS), а ее способности к прогнозированию. Период тестирования (out-of-sample) был выбран длиной в 3 и 12 месяцев для того, чтобы проверить, как изменяется качество прогнозов модели. Применение аппарата нейронных сетей В вычислительных экспериментах использовались нейронные сети слоистой структуры [1]. Пробовались различные активационные функции нейронов входного и скрытого слоев для минимизации ошибки обучения. В результате серии вычислений (см. табл. 3) была получена минимальная ошибка обучения при наборе функций сигмоида-сигмоида. Полученное выше оптимальное сочетание функций нейронов входного и скрытого слоев использовано в текущем и всех последующих тестах. При рассмотрении различных периодов минимальная ошибка при применении метода «скользящее окно» составила 12,95 %, или 79,76 пунктов в абсолютном выражении, что нельзя признать удовлетворительным для практического применения. Следующая серия экспериментов состояла в применении нейронных сетей на основе факторной зависимости. На обучение отводились различные временные промежутки. Результаты представлены в таблице 4. Таблица 3 Результаты применения различных активационных функций
Примечание: число скрытых слоев = 1, число нейронов на скрытых слоях = 10, количество эпох = 2 000. Как следует из таблицы 4, с сокращением времени обучения результаты улучшаются: уменьшается ошибка обучения (как максимальная, так и средняя). Найдена оптимальная структура нейронной сети: 3 скрытых слоя: 25, 10, 10 нейронов. Максимальная ошибка составила 12,25 в абсолютном выражении, или 0,86 %. На рисунке 1 представлены результаты прогнозирования нейронной сети на год вперед. Как видно из рисунка, нейросеть в целом справилась с предсказанием тренда. Для прогноза на 12 месяцев коэффициент детерминации [4] R2 составил -5,61, что является неприемлемо низким значением. Для прогноза на 3 месяца R2=0,999, близок к единице, что говорит о высоком качестве модели. Итак, можно сказать, что нейронная сеть, основанная на факторной зависимости, с поставленной задачей справилась. Нейронная сеть позволяет предсказывать тренд изменения индекса, а также дает квартальный прогноз с незначительной ошибкой. Применение регрессионного аппарата При построении регрессий использовался только один временной промежуток – 1995–2006. Это связано с тем, что регрессионный аппарат требует большой выборки для выявления закономерностей. На рисунке 2 представлены результаты прогнозирования авторегрессии на год вперед. Применение регрессионного аппарата с использованием метода «скользящее окно» (авторегрессия) показало, что коэффициент детерминации R2 за 12 месяцев составил неприемлемо низкое значение -19,95. За три месяца R2=-10,46, что также является неприемлемо малой величиной. Итак, авторегрессия справилась с предсказанием тренда, однако точность прогноза неприемлемо низкая. Рассмотрим применение регрессионного аппарата с использованием факторной зависимости. Регрессионная зависимость строилась на основе факторов, приведенных в таблице 1. Результаты прогнозирования отражены на рисунке 3. Как видно из рисунка, регрессия плохо справилась с предсказанием тренда. Для данной модели за 12 месяцев R2 = -7,98, что является неприемлемо низким значением. За три месяца R2=0,98, что говорит о приемлемом качестве модели. Однако в целом результат следует признать неудовлетворительным. Опишем далее применение регрессионного аппарата с использованием факторной зависимости и стационарных данных. При построении регрессии следует учесть тот факт, что исходные данные должны быть стационарными. Стационарным называется ряд, в котором дисперсия и математическое ожидание постоянны. Поэтому имеющиеся данные были остационарены методом взятия первых разностей и на их основе построена регрессия. Следует учесть, что зависимой переменной построенной модели является не значение индекса, а его доходность, то есть каждое значение индекса поделено на предыдущее. Результаты прогнозирования представлены на рисунке 4. Коэффициент детерминации за 12 месяцев составил -10448,78, что является неприемлемо низким значением. За три месяца R2=-27,13, что также является неприемлемо низким значением. Таким образом, модель не справилась с предсказанием тренда и имеет неприемлемую точность. Сравнение моделей Результаты сравнения моделей на основе коэффициента детерминации за 12 месяцев и за 3 месяца, а также качество предсказания тренда приведены в таблице 5. Таблица 5 Сравнение методов прогнозирования на основе коэффициента детерминации и экспертного качества предсказания тренда
Итак, факторная регрессия, построенная по стационарным данным, и нейросеть на основе окна не справились с предсказанием тренда. Лучший коэффициент детерминации имеет нейросеть на основе факторной зависимости с параметрами 25-10-10, построенная на временном промежутке 2003–2006. Она справилась с предсказанием тренда с достаточной точностью. Сравнение на основе трейдинговых критериев Используемые модели сравнивались по такому показателю, как коэффициент детерминации. Однако следует выяснить, насколько этот показатель подходит для индикации качества предсказательных моделей биржевой динамики. Выберем на основе рисунка 5 лучшую модель. Коэффициент детерминации левой модели выше, так как графики расположены близко друг к другу. Однако с помощью этой модели можно потерять деньги. Коэффициент детерминации правой модели ниже, однако она позволяет зарабатывать, поскольку способна предсказывать пики доходности. Из этих рассуждений можно сделать вывод, что коэффициент детерминации является довольно абстрактным показателем. Если целью, как отмечено ранее, является получение прибыли, выбирать жизнеспособные модели нужно не с помощью коэффициента детерминации, а по таким показателям, как прибыль и экономическая прибыль (взвешенная на риск). На основе приведенных рассуждений из рассмотрения были исключены модели с отрицательным коэффициентом детерминации за год ввиду плохого качества прогноза. Опишем процедуру оценки. Операция открывалась по данным модели, прибыль считалась по фактическим ценам. То есть, если модель показывала рост цены с 1 рубля до 3 рублей, открывалась длинная позиция (на покупку); пусть при этом цена реально менялась с 1 рубля до 2 рублей, таким образом, прибыль составляла 2-1=1 рубль. В качестве показателя риска был выбран дродаун – разница между максимумом и минимумом на кривой капитала, выраженная в абсолютной величине. При проведении сравнительного анализа также оценивалась точность предсказания тренда как рассчитанный в процентах показатель того, в скольких промежутках направление тренда совпадает с реальным направлением изменения цен. Таблица 6 Сравнение регрессионного аппарата и нейросетей на основе трейдинговых критериев
Как видно из таблицы 6, на более длинном временном промежутке (12 месяцев) лучшую доходность показала факторная регрессия, однако по показателю экономической прибыли выиграла нейросеть. При рассмотрении более короткого промежутка (3 месяца) нейросеть опередила факторную и авторегрессию по обоим сравниваемым показателям. Подводя итоги, отметим, что в работе на примерах прогнозирования динамики фондового индекса S&P 500 выполнен сравнительный анализ двух альтернативных методов – нейросетевого и регрессионного. В результате применения найденных оптимальных для индекса S&P 500 параметров нейросетевого моделирования лучший прогноз наблюдался при использовании нейросети с параметрами 25-10-10. Однако цель трейдера на рынке – извлечение прибыли, поэтому на втором этапе сравнения были выбраны такие трейдинговые критерии, как прибыль и прибыль, взвешенная на риск, мерой которого выбран дродаун. Доходность выбранной методики сравнивалась с доходностью пассивного держания акций. На более длинном временном промежутке лучшую доходность показала факторная регрессия, однако по показателю экономической прибыли выиграла нейросеть. При рассмотрении временного промежутка в 3 месяца нейросеть показала лучшие результаты, чем факторная регрессия и авторегрессия, по обоим рассматриваемым критериям. При этом, помня о гипотезе эффективности рынка, отметим: поскольку нейронные сети – это общедоступный инструмент, они не позволят стабильно получать сверхприбыль. С их помощью можно находить временные неэффективности, которые, однако, будут быстро устраняться действиями арбитражеров, обладающих той же информацией и предсказательными инструментами. Можно сказать, что именно они и создают эффективность рынка, считая его неэффективным, то есть пытаясь на нем заработать, получить сверхприбыль. В статье была исследована динамика индекса, поэтому полученные модели могут работать только для объяснения динамики этого индекса, а не конкретной акции. Кроме того, полученные модели не являются равновесными, не имеют экономической базы. Существует иной подход – построение моделей, основанных на известных экономических закономерностях. Функции, объясняющие эти закономерности, можно принять за спецификацию модели и оценивать количественные параметры. Используемый же в статье подход позволяет получить лишь краткосрочный прогноз и требует постоянной переоценки параметров. В целом нельзя утверждать, что нейронные сети всегда решают задачи предсказания лучше регрессионного аппарата. С помощью нейросетей нельзя построить модель, не только показывающую движение цен, но и объясняющую его причины. Кроме того, регрессионный анализ позволяет оценить соответствие коэффициентов при переменных их экономическому смыслу и улучшить качество модели, занулив несоответствующие [5]. Например, при построении зависимости доходности акций от дивидендов и балансовой стоимости был получен отрицательный коэффициент при дивидендах. Однако доходность не может обратно зависеть от дивидендов, поэтому для улучшения качества модели этот коэффициент лучше занулить. Такой прием часто используется при анализе данных фондового рынка. Регрессионные модели имеют более высокую объясняющую способность. Они позволяют выявлять закономерности в явной форме. Нейронные сети не дают ответ на вопрос «почему?». Однако проведенное исследование показывает, что они неплохо подходят для оценки биржевой динамики за счет своей гибкости и умения находить нелинейные закономерности. Несомненный плюс нейросетей также в том, что они не требуют большого объема выборки для корректного прогноза. Литература 1. Ясницкий Л.Н. Введение в искусственный интеллект. 2-е изд. М.: Издат. центр «Академия», 2008. 176 с. 2. Timmermann A., Elusive Return Predictability, 2007. URL: http://www.jstor.org/stable/pdfplus/1923455.pdf (дата обращения: 20.03.2010). 3. Goyal A., Welch I. A Comprehensive Look at the Empirical Performance of Equity Premium Prediction, Financial Studies, 2006. URL: http://www.jstor.org/pss/1907210 (дата обращения: 20.03.2010). 4. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998. 5. Campbell J.Y., Thompson S.B. Predicting the Equity Premium Out of Sample: Can Anything Beat the Historical Average? NBER Working Papers 11468, National Bureau of Economic Research, 2005. URL: http://www.jstor.org/stable/pdfplus/3241550.pdf (дата обращения: 20.03.2010). |
Permanent link: http://swsys.ru/index.php?id=3317&lang=en&page=article |
Print version Full issue in PDF (9.63Mb) Download the cover in PDF (1.26Мб) |
The article was published in issue no. № 4, 2012 [ pp. 90-96 ] |
Perhaps, you might be interested in the following articles of similar topics: