Война с роботами
Саид Гафуров — известный российский экономист, кандидат экономических наук, советник Минрегионразвития. Эта статья написана в апреле 1998 года, и является по сути развернутым ответом на статью А. Горяшко и Л. Самохина в «Рынке ценных бумаг» о нейросетевых торговых системах на финансовых рынках. Современного читателя в этой работе заинтересует прежде всего не история вопроса и конкретная статья, а поднимаемые Гафуровым общие вопросы об использовании статистики и автоматических методов в фондовом анализе.
Искуственные нейронные сети используются для решения интеллектуальных задач, используя искуственные аналоги природных структур. И естественно, для многих задач существует прекрасные нейросетевые решения. Однако сама природа для анализа сигналов (например, звуковых) использует более специализированные устройства: звук, прежде чем попасть к нервной системе, претерпевает обработку и спектральное разложение внутри среднего и внутреннего уха.
Поэтому вопрос о том, можно ли использовать в техническом анализе «голые» нейронные сети или же необходимо снабжать нейроны качественными рецепторами, специфичными для финансовых рынков до сих пор остается открытым.
И во всю ночь безумец бедный,
Куда стопы не обращал,
За ним повсюду Всадник Медный
С тяжелым топотом скакал.
А. Пушкин
Alea jacta est.
Г.Ю. Цезарь
Осенне-зимний фондовый кризис помимо прочего высветил кризис и в сфере фондового анализа и прогноза, тянущийся с самого момента зарождения практики научного прогнозирования фондового рынка в России. Давно замечено, что когда возникают новые области знаний, как, например, фондовый анализ в России, то с постоянством, достойным лучшего применения, появляются странные люди, которые, получив базовые знания, с азартом неофитов начинают проповедовать сложные методы, не заботясь об изучении их основ. Общая деградация корпоративной этики, частые случаи профессиональной несостоятельности и служебного несоответствия являются признаками ситуации подобного рода. Проблема усугубляется и тем, что в отличие от многих других областей человеческой жизни, где такого рода эксперты относительно безвредны, ошибки в фондовом прогнозировании могут стоить разорения, в том числе и крупным компаниям.
Что может быть приятней достойного оппонента?!
Иногда в полемических статьях в науке бывают работы, которые вызывают странное удовольствие у тех, с кем полемизируют. Декларируемо полемичная с моими ранее опубликованными статьями в «Рынке ценных бумаг» работа М. Болдырева «Есть ли жизнь на Марсе» вызвала у меня открытое согласие с основными тезисами автора (кроме уж совсем обидного сравнения лично меня с откровенно комедийным персонажем известного фильма). Не многие авторы, между прочим, могут похвастаться такими во всех отношениях достойными оппонентами.
Хотелось бы только отвергнуть мнение М. Болдырева о недостаточной «взвешенности» нашей статьи. Если быть честным, то тривиальность практически всех положений нашей работы и откровенная полемичность и даже провокационность тона была сознательной. Мы хотели вызвать дискуссию, и сам факт появления статьи М. Болдырева доказывает, во-первых, болезненность темы, а во-вторых, что нам удалось достичь нашей цели — поставить во главу угла болезненный вопрос о методологии статистического анализа.
Из частных дискуссий со многими специалистами (некоторые из них приезжали из такой дали, как Иркутск, чтобы обсудить эти злободневные вопросы), мне стало ясно, что проблема действительно существует. Информационная часть настоящей статьи преследует помимо прочего цель пролить свет на некоторые дискуссионные вопросы.
Мы полностью согласны с основным тезисом М. Болдырева, что необходимо учитывать стоимость решения проблемы анализа и прогноза. В этой связи проблема видится в другом, аналитики в очень многих компаниях слабо влияют на бюджетное планирование, то есть от нас не зависит, сколько средств нам будет выделено на использование в рамках фондового анализа. С другой стороны, безусловно признавая упреки М. Болдырева в запредельной академичности как стопроцентно справедливые, мы все таки оставляем открытым вопрос, как же все таки быть с конкретными проблемами, которые мы подняли ранее. Как говорят французы, «дьявол в деталях». Прежде всего: Как же быть с отсутствием эргодичности? Я не думаю, что открою большой секрет, но известнейший в среде технических аналитиков человек Роберт (Боб) Колби в переписке с автором этой статьи обсуждает проблемы неэргодичности (он, кстати, настаивает на гораздо большей степени эргодичности фондового рынка, чем я).
Я вижу проблему в том, что такой эксперт в техническом анализе как Колби считает нужным обсуждать сложности статистического анализа со мной, а М. Болдырев уходит от этой дискуссии. Надо ли это обсуждать? Мне кажется, что да, даже если это стоит денег (в рамках безусловно более корректной и более точной, чем наша, парадигмы М. Болдырева). Я, откровенно говоря, не понял (наверное, я все-таки непроходимо туп) из статьи М. Болдырева, как он относится к этой проблеме. Да, работы Болдырева и Масаловича носят прикладной характер, мы же концентрируется вокруг методологических аспектов, но независимо от того, правы ли мы или нет, обоснование допущений у консультантов должно быть начальным этапом любого прикладного проекта.
В этой связи, очень важным мне представляется общий подход к математическим методам анализа и прогноза. Из доминирующих в мире двух школ математики — интуитивистского подхода и школы Бурбаки, мы, достаточно очевидно придерживаемся второй, а «Тора-центр», что особенно ясно из многих интервью А. Масаловича, откровенные интуитивисты.
В чем разница? Это просто. Мы (следуя за известной французской энциклопедией Бурбаки) верим, что математика должна строится на строгих наборах из подмножеств (операций и элементов). Интуитивисты исходят из того, что математические концепции — это просто некие наборы ментальных понятий, которые, как и любая другая наука, опираются на эмпирическое знание.
Кто прав? Бессмысленный вопрос. Эти подходы не могут проверяться относительно друг друга на истинность. (Мы намеренно не обсуждаем здесь корректность представлений интуитивиста Л. Е. Дж. Брауера о «значении правильности» (TruthValue). Интересующиеся могут обратиться к блестящему введению в WilderR.L.IntroductiontoMathematics. L. N.Y. 1965). Важно то, что методы, разработанные в рамках одного подхода, не могут слепо применяться в рамках другого.
Здесь и возникает проблема. В общем виде, как можно говорить неспециалистам, правило просто: инструменты, разработанные в рамках подхода Фишера (максимальное правдоподобие и пр.), могут применяться без обсуждения корректности. Методы же Пирсона-Неймана, а равно и Колмогорова — это, безусловно, школа Бурбаки. Пикантность ситуации состоит в том, что в силу исторических причин, в России, безусловно, доминирует аксиоматический подход Бурбаки. Вместе с тем, с легкостью интуитивизма на практике эти методы переносятся на инструменты, где они не могут применяться без специальных оговорок, которые нередко просто опускаются.
Эту логическую ошибку крайне редко допускает А. Масалсович. Это очень здорово, и дает основания ожидать, что алгоритмы «Тора-центра» не содержат их. Увы. Распространяемый «Тора-центром» «Metastock» при выборе из фишеровского максимального правдоподобия и тинбергеновского метода наименьших квадратов по умолчанию использует последний метод без обсуждения крайне жестких (даже на наш взгляд) требований к выборкам, которые выдвигаются для наименьших квадратов. Хотелось бы надеяться, что эта проблема где-то детально обсуждалась, просто мы случайно пропустили эту дискуссию, но, как ни грустно это признавать, мы уверены в обратном.
Признаюсь в страшном для аналитика факте — наши трейдеры до сих пор уверены, что максимальное правдоподобие и метод наименьших квадратов дают идентичные результаты. Но quolisentYovi, nonlisentBovi — что дозволено нашим трейдерам, то не дозволено «Тора центру». Хотя, может быть, я просто придираюсь и ищу совершенства там, где оно не предполагается. Между прочим, лексика даже А.Масаловича все-таки восходит к Колмогорову. Впрочем, «и пошли они, солнцем палимы, повторяя „суди его бог“». Кто мы такие, чтобы судить гений Масаловича! Он прав, хотя бы потому, что Тора центр успешно работает, а, «если мы такие умные, то почему мы такие бедные?!»
Война мышей и лягушек
К сожалению, на наш взгляд, не все статьи, опубликованные в «Рынке ценных бумаг» (не могу не удержаться, чтобы не высказать свое восхищение этим превосходным на всех уровнях журналом), отличаются таким же уровнем исследовательской добросовестности, как работа М. Болдырева Классическим примером являются все чаще пропагандируемые в последнее время статистические методы, и, в особенности, нейронные сети.
Начитавшись популярной литературы (или в лучшем случае вводных учебников для нематематиков), странные люди предлагают удивительные рецепты фондового прогноза, нередко демонстрируя при этом очевидное незнание основных принципов статистики. (Например, могут предлагать рассчитать математическое ожидание для нестационарного и несходящегося временного ряда, хотя понятие математического ожидания вводится только для абсолютно сходящихся рядов (А.Горяшко, Л.Самохин. Нейросетевая торговая система FortelTrade на фьючерсных рынках. РЦБ .1/1998).
Это явно свидетельствует о том, что существующий в учебниках по теории вероятностей для нематематиков баланс между строгостью и популярностью изложения является неудовлетворительным, но само по себе это не так важно, если только люди, чье представление о статистике ограничивается такими книгами, разбавленными статьями популярной, учебной и рекламной направленности, не бросаются изобретать статистические модели, которые предлагаются для самостоятельного управления портфелем, при этом, как рекомендуют А.Горяшко и Л.Самохин, «на человека возложена лишь роль телефонной барышни».
Более чем спорно положение А.Горяшко и Л.Самохина, которое они выдают за аксиому, что «российские . рынки будут вынуждены использовать все наработанные [на „взрослых“ финансовых рынках] технологии. И технологии, наработанные на западных рынках, неизбежно будут востребованы на российских рынках ценных бумаг». Неявная логика авторов при этом состоит в том, что нет необходимости обосновывать методологическую и научную состоятельность своих концепций, раз они «успешно» применялись на западных рынках.
Мы можем с не меньшим основанием и со ссылкой на крупнейших специалистов по развивающимся рынкам утверждать прямо противоположное. Статистические технологии, наработанные на развитых (обладающих существенно большей мерой стационарности) рынках не могут применяться без кардинальной переработки на развивающихся (emerging) рынках. Статистический анализ стационарных стохастических рядов и анализ нестационарных рядов — это принципиально разные вещи. Методы, применяемые в их анализе, также различаются принципиально, даже если вместо понятия «теория стохастических процессов» использовать странную кальку с французского «теория случайных блужданий».
В отличие от безапелляционных утверждений А.Горяшко и Л.Самохина, у нас, например, вызывает сомнения, что для успешной работы на фондовых рынках необходимо и достаточно «трех составляющих тщательного изучения рынка: статистического анализа для интерпретации движений рынка; передовых компьютерных технологий для тестирования и внедрения разработанных решений». Мы уже отмечали, что на данный момент не существует статистических методов, позволяющих давать достоверные прогнозы динамики рынка, в силу неэргодичности статистических рядов экономических данных («Богатыри — не мы» РЦБ .2/1998). Мы оставляем исследовательской добросовестности А.Горяшко и Л.Самохина доказать обратное.
Один мой знакомый иностранный инвестор (между прочим, профессор по эконометрике) говорил: «на аналитиках нельзя экономить». Мы попытались дать эмпирическое обоснование этому в нашей статье «CosifanTutti фондовые аналитики» в РЦБ .24/1997. Как бы в ответ на это А.Горяшко и Л.Самохин утверждают, что «хорошая торговая система — это в первую очередь возможность кардинально уменьшить расходы, связанные с подготовкой квалифицированных финансовых игроков и аналитиков». По мере прочтения их статьи невольно создается устойчивое впечатление, что на подготовке этих авторов была действительно достигнута кардинальная экономия.
Более строгое доказательство потенциальной прибыльности фондового анализа для инвесторов даже для эффективного рынка, где действует «эдипов эффект» (возможность для всех инвесторов сделать прогноз уменьшает прибыльность прогноза), дает Шарп (Шарп У.Ф., Александер Г.Дж. и Бэйли Дж. В. «Инвестиции» (М. Инфра — М. 1997), отмечая, что даже на эффективном рынке проведение фондового анализа стоит денег, и приведенная стоимость финансовых активов включает в себя издержки на проведение фондового анализа, причем постоянная составляющая издержек достаточно велика. Именно в силу того, что отношение постоянной составляющей издержек анализа к финансовым активам у разных игроков разное, фондовый анализ может обеспечивать относительную прибыль.
Кроме того, качество обработки информации аналитиками тоже различно. Кстати, это ведет к усилению значения статистических методов редукции информации, с одной стороны, а, с другой, накладывает на фондовых аналитиков задачу постоянного поиска баланса между получением все более точных данных (с существенно более быстрым ростом издержек) и принятием решений на основании существенно неполной информации, что, в свою очередь, требует исключительно высокой квалификации от фондовых аналитиков, когда анализ, в известной степени, перестает быть наукой (в узком смысле) и становится искусством выбора корректных моделей. Кстати, эта задача в общем виде неразрешима, в силу того, что сводится к неоптимизируемым задачам исследования операций.
Здесь опять хочется возразить М. Болдыреву (полемика так полемика!). Он кое-где лукавит. Его блестящая эрудиция заставляет предположить, что он хорошо знаком с методами многомерной статистики. В рамках его (в общем, вполне справедливого) замечания о том, что я концентрируюсь на достижениях 30-40 годов без учета новейших достижений в области численных методов, хочется спросить, неужели, например, факторный (компонентный) анализ продвинулся существенно далее при использовании косинусного вращения и других современных методов по отношению к стандартному центроидному методу, который Пирсон и Стьюдент сумели реализовать на логарифмических линейках!? Конечно, нет. Просто М. Болдырев не хочет признавать обидный для всего нашего поколения (в том числе и Вашего автора) факт, что с сороковых годов в области фондового анализа не было сделано ни одного серьезного прорыва в знании. И, совсем между прочим, прорывы в военной области, о которых пишет М. Болдырев, все таки были сделаны с применением не нейросетей, а стандартных более узких методов дискриминантного анализа.
Представляется, что он напрасно пытается сделать из нас — фондовых аналитиков и трейдеров — больших идиотов, чем мы на самом деле являемся в жизни. Мы не так уж, чтобы совсем глупы. «Первые шаги» состоят совсем не в покупке «пиратских программ несложных пакетов технического анализа и статистики». Неужели, я настолько глуп, чтобы покупать то, что я могу сделать сам лучше?! Верьте или нет, но у нас в курилке обсуждаются такие, безусловно, сложнейшие вопросы, как применение индуктивных методов в вероятностных моделях, и я не думаю, что удивлю кого-нибудь, если скажу, что аналитики многих известнейших компаний за пивом обсуждают, а последние наработки в корреляционном анализе вызывая недоумение у очаровательных женщин.
Интереснейшие числовые расчеты М. Болдырева об IT- индексах и FLOPSах имеют только один недостаток. Они ничего не говорят о качестве анализа. Продолжая его рассказ об истории информационных технологий, следует сказать, что советские военные технологии, выполненные на гораздо меньших FLOPSах, как правило, не уступали, а часто и превосходили натовские. Как говаривал академик Келдыш, «на сером веществе выезжали». Фондовый анализ — узко специальная область знаний, куда в настоящий момент привлекаются лучшие интеллектуальные силы страны, сейчас носит такой же характер по кадровому составу, как разработки систем ПВО или атомной бомбы в советское время. Как можно применять стандартные методы расчетов сил и средств в области, где каждый аналитик носит особый уникальный часто невоспроизводимый характер.
Да, М. Болдырев прав в том, что наш подход носит «совковый» характер, а его — «современный и прогрессивный». Осталось только показать его практические преимущества над нашим. Мы действительно считаем, что если собрать вместе несколько способных людей и поставить перед ними задачу, то они неизбежно родят более дешевое решение, чем полученное у российских экспертов (мы знаем цену их разработкам). Чтобы не разговаривать абстрактно — два примера. При всем нашем уважении к SmartDownLoader «Тора — центра», мы его не применяем, наши программисты в свое время разработали свой загрузчик, который по определению обладает хотя бы одним достоинством перед SmartDownLoaderом — он гибче в обработке нештатных ситуаций, например, в РТС, так как мы всегда его можем настроить по новому и заново скомпилировать.
Другой пример, когда наше начальство носилось с модной тогда идеей купить нейронную сеть, мы посовещались и решили создать ее самим — из тех же соображений плюс экономия. Мы знали, что мы не многим уступаем разработчикам нейросетей в понимании статистических методов, алгоритмы есть в стандартных статистических библиотеках, а гибкость повышается значительно. Другое дело, что сама философия нейросетей против такого рода гибкости — нейросети должны обучаться самостоятельно — но это спорная философия.
И уж совсем личное замечание: мы не покупаем компьютеры на основе"166/16/12G«, как это предполагает М. Болдырев. Ваш автор, например, со времен работы на «эсэмках» всегда предпочитал компьютеры DigitalEquipmentCorporation (читай — «Альфа»), и очень расстраивается, что ему приходится работать на Intelах. Впрочем, справедливости ради скажу, что наши хозяева, однозначно отказываясь купить мне «Альфу», компенсируют это тем, что мои самые наглые требования расширить на моей персональной рабочей станции память удовлетворяются незамедлительно. Sapientisat. Знающему достаточно. Я понимаю своих начальников, когда они, умея считать деньги, решают какой компьютер купить.
Можно обсчитывать на 12 SPARC станциях, как это описывает М. Болдырев, 3500 акций в течение двух суток. Это впечатляет. Остается только показать, что результаты обсчета лучше, чем мои, когда сотня акций РТС обсчитывается с задержкой в полминуты. Кстати, к вопросу об издержках на анализ. Я специально проверял, в моих прикладных расчетах реальное время выполнения расчетов по техническому анализу существенно выше, чем по фундаментальному.
Мы действительно практически все наши разработки, основываем на критерии начальной дешевизны, но М. Болдыреву все-таки придется доказать, что наша работа — «вульгарное разбрасывание средств по ветру». Что касается «автоматизированного хаоса», то здесь упреки нашего оппонента, безусловно справедливы, но, по-моему, причина здесь вовсе не в том, где думает М. Болдырев, а в свойствах личности конкретного человека — Саида Гафурова.
Изобретатели велосипедов
Рассмотрим теперь более тщательно основные допущения статьи А.Горяшко и Л.Самохина. Прежде всего, вероятно в силу ограниченности наших знаний, нам неизвестны случаи, когда «нейросетевая парадигма. позволяет добиться лучших результатов, чем ранее известные методы». Априори итерационный подход нейросетей, по утверждению действительно знающих экспертов, всегда будет уступать специализированным методам распознавания образов (например, дискриминантному анализу даже с применением непараметрических моделей). Это частный случай более общего методологического правила: любой специализированный инструмент, настроенный на определенную задачу, всегда решает ее лучше, чем разносторонний инструмент. Стандартные методы распознавания образов, моделирующие реальные процессы (на рынке ценных бумаг, например), в этой связи всегда более эффективны, чем нейронные сети, которые моделируют деятельность мозга эксперта по фондовому рынку, а не процессы рынка.
Казалось бы, что может быть проще: выбери из алгоритмов распознавания из любой из широко распространенных библиотек статистических алгоритмов (которых только на Фортране есть больше десятка) подходящий алгоритм, адаптируй его к конкретной задаче прогнозирования, проведи обучение — при правильном выборе формы решающих функций, результат неизменно будет лучше, чем для нейронной сети. Но, как писал Высоцкий, «дуб годится на паркет, так ведь нет!». Авторы, изобретая велосипед, заново создают алгоритм на «Си плюс плюс». Еще бы! Это «передовой» метод, который должен быть разработан на современном языке. А если кто-то при этом рекомендует посчитать излишние и бессмысленные трудозатраты и отмечает, что пользователю безразлично, написана ли программа на Фортране или С++ (кстати уж, в традициях программирования нейронные сети стоит писать на Прологе или Лиспе), то он замшелый консерватор.
Совершенно нелепо утверждение авторов, что «алгоритм принятия решений, выработанный обученной нейронной сетью, не может быть изложен с помощью другого (более удобного) алгоритмического языка, т.е. попросту говоря „объяснен“». Как и любой другой метод распознавания образов, нейронные сети легко описываются в терминах многомерной геометрии. Другое дело, что здесь многомерное пространство неметризуемо, на нем не заданы некоторые функции, и возникает ряд проблем, например, максимального правдоподобия граничных функций или косинусного вращения в не метриках. Но эти проблемы решаются уже давно, и решаются успешно, в том числе, и российскими учеными. В любом случае, мне приходилось объяснять за обедом трейдерам, как работают нейронные сети «на пальцах». Они поняли.
Мне вообще кажется именно в силу того, что, как будет показано ниже, не выработана общая корректная трактовка того, что представляет собой понятие вероятности, все статистические методы основываются именно на хорошем здравом смысле, из чего следует, что они могут быть легко объяснены нормальным человеческим языком. Стремление же некоторых разработчиков использовать вызывающие ужас у машинисток формулы и часто непонятные собеседникам слова с латинскими, греческими или английскими корнями свидетельствует либо об откровенной осознанной халтуре либо о не способности связно излагать свои мысли.
На самом деле, тут, вероятно, следует остановиться на истории появления нейронных сетей. С конца шестидесятых годов, когда, с одной стороны, кибернетиками было доказано, что методы распознавания образов позволяют моделировать любую интеллектуальную деятельность человека, а, с другой стороны, психологи экспериментально показали, что нормальный человек не может генерировать последовательности случайных чисел с нормальным распределением, были сделаны попытки применить методы распознавания практически во всех областях деятельности человека. При этом постоянно возникала проблема анализа неметризируемых данных. Тогда было выбрано два основных пути преодоления этой проблемы: разработка способов обработки непараметрических данных в работающих методах и создание существенно ограниченных методов, которые получили название нейронных сетей, и могли быть быстро приспособлены для обработки любых непараметрических данных.
На сегодняшний день, любому непредвзятому специалисту очевидно, что именно разработка способов обработки непараметрических данных является более эффективным и перспективным методом. Специалисты — нематематики, использующие методы многомерной статистики, часто в шутку называют нейронные сети «распознаванием для ленивых». Что здесь еще добавить, кроме того, что модели, применяющие нормальные методы распознавания образов с учетом данных фундаментального анализа, постоянно распространяются и могут быть приобретены серьезными инвесторами? Более того, с использованием стандартных и легко доступных статистических пакетов (SPSS, SAS и многих других) не очень сложно построить такие модели самому.
Игрушка для взрослых
Подобно тому, как Леопорелло в начале чудесной оперы Моцарта рассказывает, что у дона Джованни в одной Испании было несколько десятков побед, А.Горяшко и Л.Самохин сообщают о блестящих достижениях FortelTrade при торговле индексом S&P. Почему Стандарт энд Пурз? Почему не Лукойл или не РАО ЕЭС? В этой связи, опять же на память приходит Шарп, который пишет: «может ли существовать убедительное свидетельство того, что некоторая система может постоянно обеспечивать доходность выше среднерыночной?. Для этого поиск самой системы следует осуществлять на основе одних данных, а проверку возможности ее использования для получения достоверных прогнозов — на основе совершенно других». То есть, если А.Горяшко и Л.Самохин, обучали модель на основе S&P, то нельзя использовать этот же индекс для проверки эффективности системы! Шарп заключает, что «в прошлом было немало заявлений, утверждавших, что использование некоторых механических систем, которые основаны на статистических данных и включают ряд аналитических методов, могут принести лучший результат по сравнению с пассивными инвестиционными системами.. Однако их доказательства часто строятся на зыбкой основе».
Веселым свидетельством относительной неэффективности нейронных сетей может быть забавная история, когда ради развлечения нашими аналитиками в ЛОКО-Банке на языке программы Metastock была разработана торговая система, которую позднее мы назвали DEMATS-1, эмулирующая нейронную сеть и удовлетворяющая критериям «идеальной торговой системы» А.Горяшко и Л.Самохина. Она обеспечивала по акциям РАО ЕЭС при тестировании на прошлых данных около 100% годовых в течение двух лет, а по Лукойлу около 300% годовых (и это с учетом осеннего обвала цен). Мы бы с удовольствием ее проверили на выборке S&P, которую использовали А.Горяшко и Л.Самохин.
Эту систему, которую мы воспринимаем, как забавную игрушку, любой заинтересованный человек может получить у нас бесплатно, запросив ее по электронной почте (Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.), а в дальнейшем мы планируем разместить ее на нашем сайте в Интернет. Основной недостаток DEMATS-1 (если только вообще можно говорить о недостатках в забаве) для пользователя по сравнению с FortelTrade состоит только в том, что он слабо ранжирует сигналы на покупку и продажу (всего 10 рангов).
Иными словами, сложные (хотя, как правило, человека, действительно хорошо знакомого со статистическими методами прогнозирования, коробят примитивизм и отсутствие изящества в нейронных моделях, особенно в части построения дискриминирующих функций) нейронные сети дают не лучший результат, чем копеечные игрушки, сделанные в свободное время.
Нам видятся две причины этой ситуации: первая связана именно с ограниченностью (по определению) дискриминирующих функций в нейронных сетях, а вторая носит более глубокий характер и состоит в том, что торговые системы, ориентированные только на технический анализ, всегда будут уступать системам, основанным на фундаментальный анализ. Как говорят специалисты по искусственному интеллекту, «что на входе, то и на выходе». Существуют способы строго доказать это утверждение (для игрока, ориентированного только на технический анализ, фундаментальные показатели будут равнозначными инсайдерской информации), но в целях краткости сошлемся на блестящий учебник Шарпа, Александера и Бэйли «Инвестиции» (М. Инфра — М. 1997), в котором слабая эффективность рынка определяется, через то, что доступны лишь методы технического анализа (с. 109), а А.Горяшко и Л.Самохин утверждают, что потребность в нейронных сетях на основе технического анализа растет по мере того, как рынки «становятся все более эффективными».
Если жить достаточно долго, то все возможные неприятности обязательно с Вами произойдут (Основное следствие закона больших чисел).
Восхитительная уверенность А.Горяшко и Л.Самохина в том, что «границы применимости статистического метода классификации и прогноза известны» вызывает, по меньшей мере, недоумение. Проблема границ применимости теоретико — вероятностных методов (а статистические методы включаются в теоретико — вероятностные) является одной из сложнейших проблем современной науки. Достаточно сказать, что в аксиоматике теории вероятностей Колмогорова, которая лежит в основе практически всех статистических моделей (с некоторыми исключениями, где используется аксиоматика Ричарда Фон Мизеса), пятая (о конечной аддитивности) и шестая (аксиома о континууме) (в совокупности они обеспечивают свойство счетной аддитивности) аксиомы вызывают серьезные возражения (см., напр., VonMises, Richard. Mathematical theory of probability and statistics. Academic Press. N.Y. 1964; его же Probability, Statistics and Truth. Dover. N.Y. 1981; De Finetti, Bruno. Theory of probability. Vol. I, II. John Viley. N.Y. 1974, 1975. Очень хороший, с нашей точки зрения, обзор этой дискуссии можно найти в Van Frassen, Bas C. The scientific image. ClarendonPress. Oxford. 1980). Более того, даже четвертая аксиома о том, что существует вероятность достоверного события, вызывала сомнения. Ее рассматривали как конвенционную, которая часто может быть полезной, но иногда не работает. (См., напр., Jeffreys, Harold. Theoryofprobability. Clarendon. Oxford. 1985).
Чем же еще может быть вызван отказ от аксиоматики Колмогорова, кроме как неудовлетворенностью применимостью методов, разработанных на ее основе?
Что остается от конструкции А.Горяшко и Л.Самохина после всего вышеизложенного? Сложная и дорогостоящая игрушка, в которую вложены огромные силы и средства, дезинформация менее искушенных инвесторов и бессильная горечь читателей за откровенное шарлатанство безусловно талантливых и знающих специалистов и дискредитацию профессии фондового аналитика.
На самом деле, за незрелой поверхностностью А.Горяшко и Л.Самохина скрывается существенно более серьезная проблема, которая встречается и в гораздо более основательных и безусловно заслуживающих внимания работах по фондовому прогнозированию (например, в докладе С.А. Кощиго и Х.Р.Баграмова «Потенциал российских акций», сделанном в Обществе Технических Аналитиков). Она состоит в непонимании самой сущности вероятностного подхода к прогнозированию, в непонимании, например, смысла самого понятия вероятность. Мне, обучая наших аналитиков, все время приходилось сталкиваться с проблемой объяснения, что такое вероятность. Я не думаю, что это какое то исключение из общего правила.
Одной аксиоматики недостаточно для использования теории вероятностей в задачах прогнозирования. Необходимо и понимание, что же представляет собой вероятность. Не только в России, но и в мире в численном отношении значительно доминируют статистические приложения, где вероятность понимается в смысле, традиционно возводимом к Колмогорову и Фон Мизесу. Но кроме этого подхода, который часто называется алеаторным (от латинского alea — жребий (ср. Aleajactaest)), существует и когнитивное или эпистемологическое понимание вероятности, а также и отвергаемое ныне большинством экспертов индифферентное понимание вероятности.
Индифферентный подход восходит к Гюйгенсу, Лейбницу, Бернулли и Лапласу, которые на основе анализа азартных игр определяли вероятность как отношение выигрышных исходов ко всем равновозможным исходам, при этом считалось, что исходы считаются равновозможными, если нет оснований предпочесть один исход другому. Равновозможность может пониматься как в реалистическом смысле (т.е. отсутствие доминирующих причинных воздействий), так и в эпистемологическом (связанном с отсутствием знаний о детерминированности исходов). Именно подобную трактовку вероятности неявно принимают Баграмов и Кощий, когда они рекомендуют «при расчете. „внутренней стоимости“ использовать вероятностный подход, при котором каждому значению стоимости соответствует определенная плотность вероятности». На самом деле, такая трактовка вызывает серьезные возражения.
Прежде всего, она заключает в себе порочный круг. Непонятно, в каком смысле понятие «равновозможности» отличается от «равновероятности». В очень редких случаях можно установить а priori, являются ли события равновероятными. Равновозможно ли повышение и понижение акций, находящихся в состоянии покоя (на этом допущении, между прочим, и строится строгая теория случайных блужданий)? Если нет убедительных доказательств равновозможности, то возникают логические противоречия при пермутациях, парадокс Бертрана и др. Кроме того, индифферентный подход предполагает, что по умолчанию всегда используются равномерные распределения вероятностей, то есть, нет ответа, как поступать, когда мы знаем, что будет доминировать тренд, но не знаем повышательный или понижительный. Очевидно одно, что предполагать нормальное распределение здесь абсурдно
Наконец, эта трактовка предполагает, что вероятность может принимать только рациональные значения, что ведет к тому, что, например, невозможны два независимых и равновероятных события, если вероятность их совместной реализации равна 1/2 (так как при этом вероятность каждого события равна 1/2 1/2 , что недопустимо в рамках этого подхода). Иными словами, если допустить, что вероятность того, что доходность и по государственным, и по корпоративным ценным бумагам вырастет, равна 1/2, то рост каждой из них не может быть равновозможен росту второй. Это допущение с содержательной точки зрения нелепо.
Exnihilo — nihil.
Вообще говоря, очень сильно расстраивает, когда, например, на семинаре Общества Технических Аналитиков представитель фирмы «Статистика» (очень милый пакет, кстати) ничтожно сумняшись, говорит, что он проводит анализ, желая «поработать с данными», не вдаваясь в содержательную сторону анализа мировых индексов. Сколько раз уже было сказано — статистика это не шаманство и не волшебство — это способ помочь исследователю, а не заменить его. Как можно позволять себе такие заявления. Да и реклама пакету в нашей среде плохая, я, если честно, не могу себе представить такое заявление от представителя SPSS — конкурента «Статистики», заботящегося о своей репутации.
М. Болдырев использовал старый испытанный метод полемики. Он приписал нам тезис, которого мы не делали, а затем эффектно его разгромил. Мы не задавались вопросом, «прогнозируем ли рынок вообще». Наша статья, с которой он полемизирует: обсуждала совсем другой вопрос: прогнозируем ли рынок с помощью очень конкретного набора статистических процедур. В этой статье мы попытались продолжить это обсуждение. Это повод для дальнешей дискуссии. М. Болдырев, справедливо утверждает, что ответ на вопрос, есть ли жизнь на Марсе «привел к созданию национальных космических программ разных стран». Нам очень хотелось бы надеяться, что наш вопрос о прогнозируемости рынка с помощью статистических методов даст толчок созданию новых методов фондового анализа и прогноза. Будем надеяться.
Саид Гафуров
Теория вероятностей и фондовое прогнозирование