ISSN 0236-235X (P)
ISSN 2311-2735 (E)

Journal influence

Higher Attestation Commission (VAK) - К1 quartile
Russian Science Citation Index (RSCI)

Bookmark

Next issue

4
Publication date:
09 December 2024

Neutral networks and regression models in S&P 500 index forecasting

The article was published in issue no. № 4, 2012 [ pp. 90-96 ]
Abstract:The article presents a comparative analysis of neural network modeling and regression analysis for forecasting the S&P 500 index. Initially, the forecast of the absolute value of the index is provided, then we justify the use of stationery data, that is, the return of S&P 500. The comparison of two methods is carried out in two stages. Firstly methods are compared by the coefficient of determination on the periods of three and twelve months, and by the quality of trend predictions. Note that the choice of model and its testing is performed at different time intervals (the so-called in-sample and out-of-sample periods). Taking into account the fact that the primary desire of a typical trader is to gain a profit at the second stage we have chosen such trading criteria as profit and profit, weighted on risk (drawdown). On a longer time interval (12 months) regression shows the best results, but in terms of economic gains neural network win. When we consider a shorter period (3 months) neural network has better results. Thus, neural networks are able to assess the dynamics of the stock due to its flexibility and ability to find non-linear patterns.
Аннотация:В статье проводится сравнительный анализ нейросетевого моделирования и регрессионного анализа для целей прогнозирования индекса S&P 500. Изначально строится прогноз абсолютного значения индекса, обосновывается необходимость использования стационарных данных, то есть доходности S&P 500. Сравнение методов прогнозирования осуществляется в два этапа. Сначала методы сравниваются по коэффициенту детерминации за 3 и 12 месяцев и качеству предсказания тренда доходности. Отметим, что выбор модели и ее тестирование производятся на разных временных промежутках (так называемых периодах in-sample и out-of-sample). Исходя из того, что первостепенным желанием трейдера является извлечение прибыли, на втором этапе выбираются такие трейдинговые критерии, как прибыль и прибыль, взвешенная на риск, мерой которого является дродаун. На более длинном временном промежутке (12 месяцев) лучшую доходность показала факторная регрессия, однако по показателю экономической прибыли выиграла нейросеть. При рассмотрении более короткого промежутка (3 месяца) нейросеть опередила факторную и авторегрессию по обоим сравниваемым показателям. Таким образом, нейросети хорошо подходят для оценки биржевой динамики за счет своей гибкости и умения находить нелинейные закономерности.
Authors: (oskolkovama@gmail.com) - , Russia, (parshakov.petr@gmail.com) - , Russia
Keywords: artificial intellect, index yield forecasting, s&p 500, neural network modeling
Page views: 13141
Print version
Full issue in PDF (9.63Mb)
Download the cover in PDF (1.26Мб)

Font size:       Font:

Биржевое ценообразование является наиболее эффективным способом распределения ограниченных ресурсов, в частности капитала. Поэтому ценообразование на финансовых рынках представляется актуальным направлением изучения как учеными-фундаменталистами, так и трейдерами. И если первых интересуют механизмы функционирования финансовых рынков, то цель вторых – получение прибыли путем прогнозирования цены акций либо их доходности. Наиболее популярным методом прогнозирования среди трейдеров является технический анализ, однако он описывает поведение финансового инструмента в ближайшем будущем и не объясняет причины изменения цен. Для стабильного извлечения прибыли в долгосрочном периоде необходимы иные статистические инструменты, позволяющие найти экономические закономерности, сохраняющиеся долгое время. В последние десятилетия для этих целей используется регрессионный аппарат, существенными недостатками которого являются выявление только линейных закономерностей и необходимость сбора данных за длительные промежутки времени, что в России в принципе невозможно. (Отметим, что регрессионный аппарат позволяет строить и нелинейные модели, однако вид функции, спецификацию модели необходимо выбрать до оценки параметров.) От этих недостатков избавлены методы искусственного интеллекта [1], которые, однако, мало применяются для прогнозирования цены и доходности акций. Кроме того, остается дискуссионным вопрос о сопоставлении преимуществ и недостатков этих двух математических аппаратов. В статье проводится сравнительный анализ эффективности методов нейросетевого моделирования и регрессионного анализа для прогнозирования цены и доходности акций. Каждый из них позволяет выявлять закономерности между изменениями цены и различными факторами, а также использовать саму цену в качестве единственного фактора.

Первые исследования, посвященные изучению методов прогнозирования и построению предсказательных моделей биржевой динамики, появились еще в 20-х годах прошлого века. Для решения поставленной выше задачи интересны работы, которые одновременно рассматривают различные методики прогнозирования. Нейронные сети практически не применяются в данной области, однако следует отметить работы Алана Тиммерманна [2], который для целей прогнозирования использовал и регрессии, и нейронные сети. При этом в его работе были применены только двухслойные нейронные сети с неизменяющейся структурой слоев, в то время как параметры регрессий менялись. Кроме того, выбранные им методики не тестировались на одном временном промежутке, что не позволяет проводить сравнительный анализ рассмотренных методов. Целью же настоящей статьи является именно сравнение двух методов, которые тестируются на различных по длительности промежутках. Однако длина промежутков в целях корректности эксперимента выбирается одинаковой для обеих моделей.

Кратко опишем объект исследования. Индекс S&P 500 включает 500 компаний – лидеров ведущих отраслей американской экономики и пользуется широким признанием во всем мире как лучший индикатор состояния фондового рынка США. Индекс ориентирован на сегмент рынка с высокой капитализацией, охватывая более 80 % акций американских компаний, что делает его идеальным инструментом, характеризующим состояние рынка в целом. Индекс принадлежит компании Standard & Poor's и ею же составляется.

Для построения моделей авторы использовали месячные данные о величине индекса с 1965 года, так как с того времени стала широко применяться модель САРМ для объяснения рыночной динамики, что сильно повлияло на ценообразование финансовых инструментов. Использование месячных данных объясняется необходимостью соблюдения баланса между наличием достаточного количества наблюдений для построения значимой регрессии и неслучайностью колебаний цен внутри выбранного временного промежутка. Например, дневные данные о колебаниях цен (Intra-Day) практически случайны, тогда как за месяц происходит большое число событий, создающих корреляции между ценами различных периодов, таких как выпуск отчетов, новости экономики и политики и т.д. Чтобы рассмотреть поведение выбранных методик на разных по протяженности временных промежутках, тестирование проводилось на различных периодах обучения и построения регрессий: 1965–2006, 1990–2006, 2000–2006, 2003–2006.

В качестве экзогенных факторов (табл. 1) были выбраны переменные, использованные в работе Гояла, Уэлша [3], посвященной исследованию динамики индекса S&P 500 и обосновывающей применение этих переменных для объяснения динамики фондового рынка.

Таблица 1

Экзогенные переменные

Переменная

Описание

D12, $

Дивиденды компаний, входящих в индекс S&P 500 за последние 12 месяцев

E12, $

Прибыль компаний, входящих в индекс S&P 500 за последние 12 месяцев

b/m

Соотношение балансовой и рыночной стоимости компании

Tbl

T-bill rates – котировки государственных облигаций США

AAA

Доходности облигаций компаний с различным кредитным рейтингом, от BAA до ААА

BAA

Lty

Доходность долгосрочных облигаций правительства США

Ntis

Net Equity Expansion – коэффициент (скользящий, за 12 месяцев), показывающий отношение новых акций к общей рыночной капитализации

Rfree

Безрисковая доходность

Infl

Величина инфляции

Ltr

Доходность долгосрочных облигаций (негосударственных)

corpr

Доходность корпоративных облигаций

svar

Дисперсия индекса

Подпись: Таблица 2
Реальные значения индекса и оценки моделей
Дата	Реальное значение	Оценка цены/доходности
		Нейронная сеть (факт.)	Авторегрессия	Факторная 
регрессия	Факторная регрес-сия (стац.)
200701	1438,24	1418,7516	1222,023417	1548,752	0,218564452
200702	1406,82	1376,5382	1224,818591	1560,65	-5,627317311
200703	1420,86	1364,4893	1236,287678	1614,723	-0,803467346
200704	1482,37	1405,404	1253,613319	1618,68	-0,605499206
200705	1530,62	1414,0254	1301,996449	1636,744	-1,269921051
200706	1503,35	1391,996	1344,256816	1656,208	0,831851476
200707	1455,27	1386,0798	1310,259959	1604,523	0,213324461
200708	1473,99	1296,1634	1335,028306	1631,025	-4,745558672
200709	1526,75	1377,2197	1309,505706	1633,429	0,89041493
200710	1549,38	1411,1852	1283,173393	1561,379	0,648988383
200711	1481,14	1322,1271	1321,607034	1548,035	0,902918155
200712	1468,36	1419,9702	1321,418471	1500,951	0,354602651
Результаты рассмотренных вариантов прогнозирования приведены в таблице 2, содержащей реальные значения индекса и его оценки. В случае построения регрессий использовался метод наименьших квадратов. Кроме того, при работе с реальными статистическими данными важно проверить, действительно ли желаемые ограничения (условия, определяющие классическую линейную регрессионную модель) имеют место.  Поэтому все регрессионные модели были проверены на гетероскедастичность (тест Парка), автокорреляцию остатков (авторегрессия первого порядка) и на нормальность ошибок модели (тест Жака–Бера).

Кроме того, следует отметить, что построенные модели тестировались не на той выборке, на которой были построены, так как важнее не то, как модель объясняет закономерности на этой выборке (так называемый in-sample, IS), а ее способности к прогнозированию. Период тестирования (out-of-sample) был выбран длиной в 3 и 12 месяцев для того, чтобы проверить, как изменяется качество прогнозов модели.

Применение аппарата нейронных сетей

В вычислительных экспериментах использовались нейронные сети слоистой структуры [1]. Пробовались различные активационные функции нейронов входного и скрытого слоев для минимизации ошибки обучения. В результате серии вычислений (см. табл. 3) была получена минимальная ошибка обучения при наборе функций сигмоида-сигмоида.

Полученное выше оптимальное сочетание функций нейронов входного и скрытого слоев использовано в текущем и всех последующих тестах. При рассмотрении различных периодов минимальная ошибка при применении метода «скользящее окно» составила 12,95 %, или 79,76 пунктов в абсолютном выражении, что нельзя признать удовлетворительным для практического применения.

Следующая серия экспериментов состояла в применении нейронных сетей на основе факторной зависимости. На обучение отводились различные временные промежутки. Результаты представлены в таблице 4.

Таблица 3

Результаты применения различных активационных функций

Функция входного слоя

Функция скрытого слоя

Максимальная ошибка

Средняя ошибка

Линейная

Сигмоида

127,84

0,00029

Сигмоида

Сигмоида

79,76

0,00078

Ле-Кана

Ле-Кана

146,67

0,00033

Логарифм

Сигмоида

Расходится

Сигмоида

Ле-Кана

163,93

0,00056

Сигмоида

Логарифм

Расходится

Логарифм

Ле-Кана

Расходится

Примечание: число скрытых слоев = 1, число нейронов на скрытых слоях = 10, количество эпох = 2 000.

Как следует из таблицы 4, с сокращением времени обучения результаты улучшаются: уменьшается ошибка обучения (как максимальная, так и средняя). Найдена оптимальная структура нейронной сети: 3 скрытых слоя: 25, 10, 10 нейронов. Максимальная ошибка составила 12,25 в абсолютном выражении, или 0,86 %.

На рисунке 1 представлены результаты прогнозирования нейронной сети на год вперед. Как видно из рисунка, нейросеть в целом справилась с предсказанием тренда.

Для прогноза на 12 месяцев коэффициент детерминации [4] R2 составил -5,61, что является неприемлемо низким значением. Для прогноза на 3 месяца R2=0,999, близок к единице, что говорит о высоком качестве модели.

Подпись: Таблица 4
Результаты тестирования нейросетевых моделей различной структуры 
на основе факторной зависимости с различным периодом обучения
Период 
обучения, гг.	Номер 
попытки	Количество скрытых слоев	Нейроны на скрытых слоях	Максимальная ошибка	Средняя ошибка	Количество эпох
1965–2006	1	1	10	447,06	0,00015	1000
	2	1	25	489,82	0,00016	1000
	3	2	25_10	378,49	0,00015	1000
	4	5	25_10_10_10_10	438,88	0,00021	1000
1990–2006	1	1	10	439,92	0,00093	2000
	2	1	25	410,23	0,00049	1000
	3	1	35	342,5	0,00061	1000
	4	2	25_10	443,75	0,00085	1000
	5	3	25_10_10	403,95	0,00052	2000
	6	5	25_15_10_10_10	430,54	0,00086	1000
2001–2006	1	1	10	111,24	0,00141	1000
	2	1	10	84,5	0,00108	2000
	3	1	10	38,34	0,00039	7000
	4	2	20	64,85	0,00052	5000
	5	3	25_10	52,52	0,00042	2000
	6	3	25_20_10	19,47	0,00012	20000
	7	5	25_20_20_10_10	34,99	0,0002	5000
	8	3	25_20_20	61,79	0,00015	30000
	9	3	25_20_10	40,63	0,00024	30000
2003–2006	1	3	25_10_10	12,245	0,00016	17000
Итак, можно сказать, что нейронная сеть, основанная на факторной зависимости, с поставленной задачей справилась. Нейронная сеть позволяет предсказывать тренд изменения индекса, а также дает квартальный прогноз с незначительной ошибкой.

Применение регрессионного аппарата

При построении регрессий использовался только один временной промежуток – 1995–2006. Это связано с тем, что регрессионный аппарат требует большой выборки для выявления закономерностей.

На рисунке 2 представлены результаты прогнозирования авторегрессии на год вперед.

Применение регрессионного аппарата с использованием метода «скользящее окно» (авторегрессия) показало, что коэффициент детерминации R2 за 12 месяцев составил неприемлемо низкое значение -19,95. За три месяца R2=-10,46, что также является неприемлемо малой величиной. Итак, авторегрессия справилась с предсказанием тренда, однако точность прогноза неприемлемо низкая.

Подпись:  
Рис. 1. Прогноз нейросети
 
Рис. 2. Прогноз авторегрессии 
 
Рис. 3. Прогноз факторной регрессии
– – –  – на год; _________ – реальные значения
  
Рис. 4. Прогноз факторной регрессии: – – –  – на год со стационарными данными; _________ – реальные значения
Рассмотрим применение регрессионного аппарата с использованием факторной зависимости. Регрессионная зависимость строилась на основе факторов, приведенных в таблице 1. Результаты прогнозирования отражены на рисунке 3. Как видно из рисунка, регрессия плохо справилась с предсказанием тренда. Для данной модели за 12 месяцев R2 = -7,98, что является неприемлемо низким значением. За три месяца R2=0,98, что говорит о приемлемом качестве модели. Однако в целом результат следует признать неудовлетворительным.

Опишем далее применение регрессионного аппарата с использованием факторной зависимости и стационарных данных. При построении регрессии следует учесть тот факт, что исходные данные должны быть стационарными. Стационарным называется ряд, в котором дисперсия и математическое ожидание постоянны. Поэтому имеющиеся данные были остационарены методом взятия первых разностей и на их основе построена регрессия. Следует учесть, что зависимой переменной построенной модели является не значение индекса, а его доходность, то есть каждое значение индекса поделено на предыдущее.

Результаты прогнозирования представлены на рисунке 4.

Коэффициент детерминации за 12 месяцев составил -10448,78, что является неприемлемо низким значением. За три месяца R2=-27,13, что также является неприемлемо низким значением. Таким образом, модель не справилась с предсказанием тренда и имеет неприемлемую точность.

Сравнение моделей

Результаты сравнения моделей на основе коэффициента детерминации за 12 месяцев и за 3 месяца, а также качество предсказания тренда приведены в таблице 5.

Таблица 5

Сравнение методов прогнозирования на основе коэффициента детерминации и экспертного качества предсказания тренда

Рассматриваемая модель

R2 за 12 месяцев

R2 за 3 месяца

Предсказание тренда (max 0–5)

Окно

-348,56

-312,23

0

Нейросеть 25_10_10

-5,61

0,99

4

Авторегрессия

-19,94

0,97

2

Факторная регрессия (нестац.)

-7,89

0,98

3

Факторная регрессия (стац.)

-10448,78

-27,13

0

Итак, факторная регрессия, построенная по стационарным данным, и нейросеть на основе окна не справились с предсказанием тренда. Лучший коэффициент детерминации имеет нейросеть на основе факторной зависимости с параметрами 25-10-10, построенная на временном промежутке 2003–2006. Она справилась с предсказанием тренда с достаточной точностью.

Сравнение на основе трейдинговых критериев

Используемые модели сравнивались по такому показателю, как коэффициент детерминации. Однако следует выяснить, насколько этот показатель подходит для индикации качества предсказательных моделей биржевой динамики.

Выберем на основе рисунка 5 лучшую модель. Коэффициент детерминации левой модели выше, так как графики расположены близко друг к другу. Однако с помощью этой модели можно потерять деньги. Коэффициент детерминации правой модели ниже, однако она позволяет зарабатывать, поскольку способна предсказывать пики доходности.

Из этих рассуждений можно сделать вывод, что коэффициент детерминации является довольно абстрактным показателем. Если целью, как отмечено ранее, является получение прибыли, выбирать жизнеспособные модели нужно не с помощью коэффициента детерминации, а по таким показателям, как прибыль и экономическая прибыль (взвешенная на риск).

Подпись:   
Рис. 5. Условная динамика доходности:
 _________ – реальная динамика доходности, – – – –  – данные модели
На основе приведенных рассуждений из рассмотрения были исключены модели с отрицательным коэффициентом детерминации за год ввиду плохого качества прогноза.

Опишем процедуру оценки. Операция открывалась по данным модели, прибыль считалась по фактическим ценам. То есть, если модель показывала рост цены с 1 рубля до 3 рублей, открывалась длинная позиция (на покупку); пусть при этом цена реально менялась с 1 рубля до 2 рублей, таким образом, прибыль составляла 2-1=1 рубль. В качестве показателя риска был выбран дродаун – разница между максимумом и минимумом на кривой капитала, выраженная в абсолютной величине.

При проведении сравнительного анализа также оценивалась точность предсказания тренда как рассчитанный в процентах показатель того, в скольких промежутках направление тренда совпадает с реальным направлением изменения цен.

Таблица 6

Сравнение регрессионного аппарата и нейросетей на основе трейдинговых критериев

Критерий сравнения

Нейросеть 25_10_10

Факторная регрессия

(нестац.)

Авторегрессия

за 12 месяцев

Тренд

63,64 %

72,73 %

54,55 %

Дродаун

231,24

274,48

163,33

Станд. откл.

71,11

89,01

52,47

Прибыль

218,46

243,06

1,06

Доходность

218,46 %

243,06 %

0,01

Экономическая прибыль

0,94

0,89

0,0065

за 3 месяца

Тренд

66,67 %

66,67 %

66,67 %

Дродаун

78,89

75,55

75,55

Станд. откл.

29,31

28,42

28,42

Прибыль

78,89

44,13

44,13

Доходность

78,89 %

44,13 %

0,44

Экономическая прибыль

1,00

0,58

0,584

Как видно из таблицы 6, на более длинном временном промежутке (12 месяцев) лучшую доходность показала факторная регрессия, однако по показателю экономической прибыли выиграла нейросеть. При рассмотрении более короткого промежутка (3 месяца) нейросеть опередила факторную и авторегрессию по обоим сравниваемым показателям.

Подводя итоги, отметим, что в работе на примерах прогнозирования динамики фондового индекса S&P 500 выполнен сравнительный анализ двух альтернативных методов – нейросетевого и регрессионного. В результате применения найденных оптимальных для индекса S&P 500 параметров нейросетевого моделирования лучший прогноз наблюдался при использовании нейросети с параметрами 25-10-10. Однако цель трейдера на рынке – извлечение прибыли, поэтому на втором этапе сравнения были выбраны такие трейдинговые критерии, как прибыль и прибыль, взвешенная на риск, мерой которого выбран дродаун. Доходность выбранной методики сравнивалась с доходностью пассивного держания акций. На более длинном временном промежутке лучшую доходность показала факторная регрессия, однако по показателю экономической прибыли выиграла нейросеть. При рассмотрении временного промежутка в 3 месяца нейросеть показала лучшие результаты, чем факторная регрессия и авторегрессия, по обоим рассматриваемым критериям.

При этом, помня о гипотезе эффективности рынка, отметим: поскольку нейронные сети – это общедоступный инструмент, они не позволят стабильно получать сверхприбыль. С их помощью можно находить временные неэффективности, которые, однако, будут быстро устраняться действиями арбитражеров, обладающих той же информацией и предсказательными инструментами. Можно сказать, что именно они и создают эффективность рынка, считая его неэффективным, то есть пытаясь на нем заработать, получить сверхприбыль.

В статье была исследована динамика индекса, поэтому полученные модели могут работать только для объяснения динамики этого индекса, а не конкретной акции. Кроме того, полученные модели не являются равновесными, не имеют экономической базы. Существует иной подход – построение моделей, основанных на известных экономических закономерностях. Функции, объясняющие эти закономерности, можно принять за спецификацию модели и оценивать количественные параметры. Используемый же в статье подход позволяет получить лишь краткосрочный прогноз и требует постоянной переоценки параметров.

В целом нельзя утверждать, что нейронные сети всегда решают задачи предсказания лучше регрессионного аппарата. С помощью нейросетей нельзя построить модель, не только показывающую движение цен, но и объясняющую его причины. Кроме того, регрессионный анализ позволяет оценить соответствие коэффициентов при переменных их экономическому смыслу и улучшить качество модели, занулив несоответствующие [5]. Например, при построении зависимости доходности акций от дивидендов и балансовой стоимости был получен отрицательный коэффициент при дивидендах. Однако доходность не может обратно зависеть от дивидендов, поэтому для улучшения качества модели этот коэффициент лучше занулить. Такой прием часто используется при анализе данных фондового рынка.

Регрессионные модели имеют более высокую объясняющую способность. Они позволяют выявлять закономерности в явной форме. Нейронные сети не дают ответ на вопрос «почему?». Однако проведенное исследование показывает, что они неплохо подходят для оценки биржевой динамики за счет своей гибкости и умения находить нелинейные закономерности. Несомненный плюс нейросетей также в том, что они не требуют большого объема выборки для корректного прогноза.

Литература

1.     Ясницкий Л.Н. Введение в искусственный интеллект. 2-е изд. М.: Издат. центр «Академия», 2008. 176 с.

2.     Timmermann A., Elusive Return Predictability, 2007. URL: http://www.jstor.org/stable/pdfplus/1923455.pdf (дата обращения: 20.03.2010).

3.     Goyal A., Welch I. A Comprehensive Look at the Empirical Performance of Equity Premium Prediction, Financial Studies, 2006. URL: http://www.jstor.org/pss/1907210 (дата обращения: 20.03.2010).

4.     Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. М.: ЮНИТИ, 1998.

5.     Campbell J.Y., Thompson S.B. Predicting the Equity Premium Out of Sample: Can Anything Beat the Historical Average? NBER Working Papers 11468, National Bureau of Economic Research, 2005. URL: http://www.jstor.org/stable/pdf­plus/3241550.pdf (дата обращения: 20.03.2010).


Permanent link:
http://swsys.ru/index.php?id=3317&lang=en&page=article
Print version
Full issue in PDF (9.63Mb)
Download the cover in PDF (1.26Мб)
The article was published in issue no. № 4, 2012 [ pp. 90-96 ]

Perhaps, you might be interested in the following articles of similar topics: