Математическое обоснование парного трейдинга
В парной торговле трейдер делает предположение о синхронности движения высококоррелированных активов. Акции компании одной отрасли должны, согласно этой теории, реагировать одинаково на внешний фон, если он не затрагивает непосредственно только одну из них. Динамика цен повторяет друг друга, а любое отклонение от привычного паритета должно быть компенсировано одной или другой акцией. Можно использовать идею "статистического паритета" для построения стабильной торговой системы. В этой статье я хочу показать математическую составляющую этого подхода.
В последнее время все большую популярность приобретает системный и механический трейдинг. Немалую роль в этом сыграл и проводимый биржей РТС ежегодный конкурс среди частных трейдеров, где основная борьба разворачивается между скальперами (высокочастотными интуитивными трейдерами) и механическими торговыми системами, способными совершать сотни или даже тысячи сделок в день. Систематизация торговли позволяет взглянуть на свой подход со стороны объективного наблюдателя. Не секрет, что основным врагом и источником убытков являются чрезмерные эмоции, которые трейдер неизменно испытывает во время торговли. Радость от прибыли или разочарование от убытка искажают восприятие текущей ситуации на рынке, вызывая чувство ложной правоты или желание непременно отыграться.
А механический подход избавляет своего создателя от необходимости принимать торговые решения под давлением собственных эмоций. Выверенный и оттестированный алгоритм легко покупает на кажущихся вершинах или обрезает убыток, когда "рынок вот-вот развернется и пойдет в мою сторону".
Постоянная реализация статистического преимущества - вот основная задача любой торговой системы. И ее прибыльность зависит только от алгоритма этого самого "преимущества". Можно построить рискованную торговую стратегию и тогда непременным атрибутом роботорговца станет упаковка валидола и мечта о прибыли с шестью нулями. Но есть и более прагматичная группа системных трейдеров, которые готовы пожертвовать частью потенциальной прибыли ради стабильности и уверенности в ее достижении. Они имеют в своем арсенале низкорисковые или, так называемые, безрисковые стратегии. Конечно, определенный риск в них все же присутствует, но его величина держится под строгим математическим контролем. В качестве примера можно привести структурные продукты, арбитражные сделки или "торговлю парами". Собственно, арбитраж подразумевает поиск неверно оцененных инструментов, поэтому парный трейдинг смело можно отнести к разновидности арбитража. Арбитраж бывает нескольких видов:
- межрыночный арбитраж;
- математический арбитраж;
- статистический арбитраж.
Межрыночный арбитраж возможен в том случае, когда один и тот же инструмент торгуется на разных рынках по разным ценам. Это может быть, например, фьючерс на золото или акции. Самая обсуждаемая идея межрыночного арбитража на отечественных биржах - торговля акциями ММВБ против депозитарных расписок на эти же акции, торгующихся на нью-йоркской бирже. Суть этой идеи в том, чтобы покупать акции там, где дешевле и шортить там, где дороже. После этого либо ждать, пока цены выровняются (чего можно ждать бесконечно долго), либо осуществлять физическую поставку акций от одного брокера к другому. Но эта процедура не из легких, финансово и юридически, и она мало интересна даже крупным участникам рынка. Поэтому мы часто можем наблюдать ситуацию, когда один и тот же инструмент на разных рынках отличается в цене на несколько процентов. Другой возможной ситуацией могла бы стать арбитражная торговля фьючерсом на золото на нашей бирже ФОРТС против аналогичных контрактов в Лондоне. Но из-за ограничений в ликвидности наших бирж этот подход так же вряд ли заинтересует крупных трейдеров. Вариант, который наиболее жизнеспособен - это торговля акциями ММВБ против аналогичных акций РТС, но и тут можно упереться в проблему ликвидности биржи РТС.
Математический арбитраж - самый простой для понимания, наиболее часто торгуемый и от того наименее прибыльный. Его суть в том, чтобы математически расчитать стоимость одного актива относительно другого. В основе этого метода, как правило, лежит временнАя стоимость денег. Допустим, нужная мне акция стоит 110 рублей. По идее, я могу не покупать ее сейчас, а положить 100 рублей в банк под 10% годовых и купить эту акцию через год. Но проблема в том, что деньги дешевеют со временем, их покупательная способность падает и, следовательно, цены растут. Поэтому 100 рублей сейчас и 110 рублей через год - это одно и то же. А акция, которая сейчас стоит 110 рублей, через год будет стоить 121 рубль, и нам опять не хватит на нее денег. Этот феномен назывется "дисконтирование". Сейчас не буду приводить формулы, но фьючерс с поставкой через три месяца обязательно должен быть дешевле фьючерса с поставкой через шесть месяцев. И при этом он должен быть ровно на столько же дороже своего базового актива. Таким образом, расчитывая отклонения во временнОй стоимости, мы можем определить ситуацию "контанго" или "беквордации", когда существует возможность гарантированного математического арбитража. В этом случае цены обязательно достигнут своих справедливых уровней, а если не достигнут, то произойдет поставка или взаимозачет по фьючерсам. Именно на этой теории построена идея календарного и сезонного арбитража. Но из-за простоты технической реализации воспользоваться этой идеей могут практически все, поэтому здесь возможности появляются редко, а доходность по ним, как правило, мала. Сюда же можно отнести, например, различные опционные стратегии, когда по математическим формулам оценивается один опцион относительно цены аналогичного, но с другим страйком или датой исполнения.
Статистическим арбитражем можно назвать аналогичную ситуацию, но вероятность реализации которой не равна 100%. Проще говоря, в этом случае цены "скорее всего достигнут своих справедливых уровней". Сюда можно отнести парную торговлю, когда трейдер делает предположение о синхронности движения высококоррелированных активов. Акции компании одной отрасли должны, согласно этой теории, реагировать одинаково на внешний фон, если он не затрагивает непосредственно только одну из них. Динамика цен повторяет друг друга, а любое отклонение от привычного паритета должно быть компенсировано одной или другой акцией. Так например, акции Сбербанка и ВТБ относятся к одному сектору экономики - финансовому. Поэтому было бы логично предположить, что на мировые новости их цены будут реагировать одинаково. И использовать идею "статистического паритета" для построения стабильной торговой системы. В этой статье я хочу показать математическую составляющую этого подхода.
Для начала возьмем цены акций, у которых можно было бы предположить наличие определенной синхронности в динамике - Газпрома и Лукойла. В терминах эконометрики, цены акций представляют из себя нестационарные временнЫе ряды. Это означает, что в них нет никакого абсолютно постоянства, математическое ожидание и стандартное отклонение в этом случае статистически плохо прогнозируемы и непостоянно изменяются. Поэтому проверим уровень коинтеграции этой пары акций, чтобы определить порядок дальнейших действий. Наличие коинтеграции будет означать, что возможно выделить стационарную компоненту, используя линейную комбинацию цен Газпрома и Лукойла.
Тест Йохансена показывает коинтеграцию 4 и 5 порядка. Это означает, что в ценах на акции присутствует линейный и экспоненциальный тренды и различающая их константа. Информационные критерии, выделенные красным овалом, показывают различные уровни коинтеграции, потому что этот первичный тест имеет пока указанные выше допущения. Значит, теперь необходимо преобразовать имеющиеся ценовые ряды, чтобы избавиться от трендов, нормировать и центрировать цены. Для этого проведем следующие итерации:
1. Расчитаем логарифмы цен. Это позволит убрать квадратичный тренд, присущий ценам на акции, если анализируется достаточно большой промежуток времени.
2. Рассчитаем среднее значение логарифмов цен всего доступного массива котировок и вычтем его. Это позволит центрировать весь ряд относительно нуля и избавиться от константы.
3. Рассчитаем стандартное отклонение логарифмов цен, после чего разделим на него центрированный ряд. Это позволит нам нормировать котировки для более корректного анализа.
Теперь проделаем все эти операции подготовки для всех акций из списка ММВБ10. Возможно, нам удастся найти более коррелированные акции для дальнейшей работы. На графике представлены скорректированные ряды котировок:
еперь хорошо видна высокая коррелированность нашего фондового рынка. Акции ходят практически маршем. Далее необходимо рассчитать матрицу парных корреляций. Для этого сначала нужно синхронизировать их во времени, убрав даты, когда отсутствуют цены одного или нескольких инструментов, что особенно часто встречается во время кризиса 2008 года. Рассмотрим матрицу парных корреляций:
В сводной таблице представлены 4 различных подхода в определении коэффициента корреляции.
Первая таблица - матрица корреляций чистых, никак не подготовленных цен на акции ММВБ10. Примечательно, что наибольшая корреляция оказалась у пары ВТБ - Уралсвязьинформ. Это можно объяснить тем, что абсолютные значения цен заметно ниже, чем у остальных. Поэтому сразу становится понятна необходимость в центрировании ценовых рядов для корректного сравнения.
Вторая и третья - полностью скорректированная матрица и матрица, которая не подвергалась нормированию по волатильности. Примечательно, что значения одинаковы. Наибольшей корреляцией в этом случае обладает пара Роснефть - Газпромнефть. Хотя и предыдущий лидер отстал не намного.
В четвертой матрице реализован самый корректный, с точки зрения эконометрики, способ определения парных корреляций. Поскольку даже нормированные ряды обладают нестационарностью и остаточными трендовыми движениями (присущими финансовым рынкам), то необходимо перейти к абсолютным приращениям цен скорректированных рядов. В противном случае можно попасть на «ложную корреляцию», присущую рядам, в графиках которых присутствует выраженный наклон. Рассчитываются приращения просто, путем вычитания предыдущих цен из последующих. Этот подход применялся для определения корреляций торговых систем в моей статье «О составлении портфеля систем». Хорошо видно, что в четвертой матрице исправлены все ошибки, оставшиеся в первой. Самая коррелированная пара теперь - Лукойл - Газпром. Но для дальнейшего анализа я остановлюсь на паре Роснефть - Газпромнефть.
Теперь, скорректировав и найдя высококоррелированную пару, я опять проверю ее на коинтеграцию:
ест показал наличие коинтеграции первого уровня, а это означает, что линейная комбинация этих двух рядов будет обладать определенной стационарностью. Вычитаем один нормированный ряд из другого и посмотрим полученный график:
Визуально можно признать полученный ряд стационарным, потому что значения крутятся во времени вокруг нуля. Но это пока не совсем то, что нам хотелось бы. Проверим степень автокоррелированности полученного ряда, чтобы определить его структуру:
Высокая автокорреляция говорит о присутствующих трендовых компонентах, частная автокорреляция минимальна. Сама форма коррелограммы не свойственна полностью стационарному ряду, поэтому можно проделать еще одну операцию. Проверяем показания теста Дикки-Фуллера на стационарность:
Гипотеза о наличии стационарности не отвергается, но t-статистика находится практически на границе допустимости, а R-квадрат сигнализирует о низкой степени. Как и в случае с определением парных корреляций можно выделить стационарность ряда, вычислив последовательные разницы элементов. Тогда мы, конечно же, добьемся высокого уровня стационарности, но вот строить торговые системы с полученными стационарными данными будет проблематично. Чтобы убить двух зайцев сразу, можно вычитать усредненные значения, тем самым немного жертвуя степенью стационарности. Вычтем из полученного ряда 5-периодную скользящую среднюю линию и посмотрим на график:
Отличная кардиограмма. Это именно то, чего мы добивались. График постоянно колеблется вокруг нуля, значит можно сделать предположение о постоянном нулевом матожидании. Волатильность немного меняется во времени, тем самым предоставляя нам возможность арбитражных операций. Теперь еще раз сделаем тест Дикки-Фуллера на стационарность временнОго ряда:
Показатели теста свидетельствуют о стационарности полученного ряда. t-статистика и R-квадрат на приемлемом уровне. Нет смысла добиваться абсолютной стационарности, потому что тогда не будет возможности для арбитражных сделок. Теперь можно проверить статистические показатели и распределение полученного временнОго ряда:
Хорошо видно, что распределение напоминает рыночное распределение Лапласа с длинными хвостами. Среднее значение и медиана находятся около нуля. Теперь, когда нужный стационарный ряд получен, можно сказать пару слов о том, почему же нам так нужна была именно стационарность.
Механические торговые системы анализируют текущую ситуацию на рынке при помощи встроенных в них математических алгоритмов. Сигналы на открытие и закрытие позиций генерируются в случае выполнения определенных условий. А эти самые условия определяются различными параметрами, оптимальные значения которых выбрал непосредственно пользователь после тщательного анализа исторических котировок. Вот тут и кроется главный подводный камень всей системной торговли: параметры системы в той или иной степени подгоняются под прошлую историю, а будущее совсем не обязательно останется таким же ожидаемым. Другими словами, оптимизированные значения могут и не принести трейдеру прибыль. Стационарный же ряд куда более предсказуем со статистической точки зрения и изменяется в допустимых границах. Поэтому больше вероятность, что оптимальные в прошлом значения параметров будут оставаться и далее оптимальными. Для стационарного ряда проблема подгонки и переоптимизации стоит гораздо менее остро.
В этой статье я хотел показать математическую составляющую парного трейдинга. Торговля парами действительно основана на стационарности отклонений от среднего спреда между двумя акциями. В качестве рекомендаций для поиска подходящих пар можно выделить следующие пункты:
- при поиске коинтегрированных пар обязательно нужно работать с логарифмами цен, потому что в противном случае сильное искажение будет вносить квадратичный тренд;
- при определении парных корреляций желательно работать с приращениями логарифмов цен, потому что наличие общего тренда на фондовом рынке может неоправданно завышать степень корреляции;
- полученная разница цен обладает слабой стационарностью и высокой автокорреляцией, поэтому желательно работать с более стационарным рядом - отклонением спреда от своих средних значений. Нужно заметить, что с увеличением диапазона усреднения стационарность ряда начинает заметно падать. Но и слишком маленькая величина усреднения тоже не позволит эффективно проводить арбитражные сделки из-за высокой частоты.
Тарас Правдюк
Русский Трейдер