Проблема робастности и пути ее решения
Серия интересных работ, раскрывающая суть обсуждаемой здесь проблемы, принадлежит Л. Жангу, П. Мюкланду и Я. Аит-Сахалиа. Главная мысль, лежащая в основе этих работ, заключается в том, что наблюдаемые отсчеты процесса цен X (tj) фактически наблюдаются с шумом, который возникает как из ошибок измерения, так и из рыночных микроструктурных эффектов, в частности разницы между ценой продавца… Читать ещё >
Проблема робастности и пути ее решения (реферат, курсовая, диплом, контрольная)
Серия интересных работ, раскрывающая суть обсуждаемой здесь проблемы, принадлежит Л. Жангу, П. Мюкланду и Я. Аит-Сахалиа. Главная мысль, лежащая в основе этих работ, заключается в том, что наблюдаемые отсчеты процесса цен X (tj) фактически наблюдаются с шумом, который возникает как из ошибок измерения, так и из рыночных микроструктурных эффектов, в частности разницы между ценой продавца и покупателя (bidask spread). Таким образом, мы фактически наблюдаем значения.
где процесс X ненаблюдаем, a et. — независимые шумы с нулевым средним и конечной дисперсией, не зависящие от процесса X. Для зашумленных наблюдений ситуация резко меняется, и эмпирическая волатильность перестает быть состоятельной оценкой интегральной волатильности.
Действительно, в работе указанных авторов[1] прямым подсчетом показано, что.
Чем чаще будут совершаться отсчеты, т. е. увеличиваться п, тем хуже будет оценка из-за огромного смещения.
Таким образом, эмпирическая волатильность оценивает, вообще говоря, не то, что подразумевается, а скорее дисперсию шумов. Действительно, если поделить обе части последнего равенства на 2п, то, как показано в работе Жанга, Мюкланда и Аит-Сахалиа [2], получим
Из формулы (8.18) следует, что дисперсия шумов состоятельно оценивается посредством величины.
Вместе с тем финансисты и трейдеры прекрасно знают, что снимать данные о ценах, скажем, каждую секунду, хотя это и возможно технически, неразумно, и никогда так не поступают. Они это делают не чаще, чем раз в 5 мин, т. е. в 300 раз реже, чем возможно. Это подтверждается и рядом графиков, где оценка волатильности явно становится хуже в зависимости от частоты отсчетов (рис. 8.1).
Рис. 8.1. График эмпирической волатильности цен акций Сбербанка России за 10 февраля 2016 г.
На рис. 8.1 представлены данные расчета оценки волатильности цен акций Сбербанка за один торговый день. В этот день осуществлено 84 147 сделок, в среднем одна каждые 0,374 с. Значение частоты, равное единице, соответствует оценке эмпирической волатильности при использовании всех данных, равное двум, — при использовании каждой второй точки данных и т. д.
Появляется следующее противоречие: с одной стороны, частое снятие данных увеличивает роль шумов, с другой стороны, законы статистики запрещают выбрасывать значительную часть наблюдений.
Возникает вопрос: каким же образом распорядиться выбрасываемыми наблюдениями и содержащейся в них информацией?
Поступим следующим образом. Разделим сетку точек G = (t0, tv …, tn) на К непересекающихся подсеток вида (tk_x, tk_UK, …ytk_x+4K). Здесь nk — число элементов сетки. Обозначим через tj+ элемент сетки, следующий за tj. Тогда разумно вычислить набор «редких» эмпирических волатильностей по подсеткам:
а затем взять их усреднение:
Ясно, что усреднение, как обычно в статистике, уменьшает дисперсию. Число К может зависеть от п, но п/К —> °°. Типичный выбор — это К = = 0(п2/3).
Кроме борьбы с шумами, не следует забывать об ошибке при дискретизации, когда мы заменяем эмпирической волатильностью истинную интегральную волатильность. С учетом всего этого предлагается скомбинировать две временные шкалы (all) и (avg), рассматривая оценку.
Теорема 8.2. Предположим, что X — процесс Ито, при этом накладываются некоторые слабые условия регулярности на коэффициенты соответствующего стохастического уравнения и, кроме того, значения волатильности должны быть отделены от нуля. Пусть, кроме того, К = 0(я2/3). Тогда:
- а) (X, Х)п К — состоятельная оценка интегральной волатильности',
- б) (Х, Х)п К — асимптотически нормальная ее оценка, более точно, имеет место сходимость по распределению
где асимптотическая дисперсия т2 имеет некоторое выражение в терминах моделих.[3]
Как оказалось, эго промежуточный результат, который можно улучшить, вводя не две, а несколько шкал исходя из соотношения.
где а, — некоторые, нетривиальным образом подбираемые числовые коэффициенты.
При этом получается оценка сходимости не 0(nV6), как в формуле (8.20), а неулучшаемая скорость 0(пх/4). Соответствующий результат был получен Л. Жангом в 2006 г.[4] Подробности данного направления исследований читатель может найти в обзоре Я. Ю. Никитина [5][6].
Обратим внимание на то, что вопрос о выборе оптимального числа наблюдений при оценке тех или иных величин, необязательно относящихся к финансовой сфере, рассматривался и раньше, в том числе и в научно-популярной литературе3 4, написанной на основе академических исследований, посвященных данному вопросу. При этом любопытно, что необходимость в прореживании исходной выборки исходя из зависимости 0(п/3) от общего числа наблюдений, равного п, отмечалась ранее, в том числе и в книге П. Е. Эльясберга4.
- [1] 2 Zhang L., Mykland Р.Л., Ait-Sakhalia У. A tale of two time scales: determining integratedvolatility with noisy high-frequenev data //Journal of Amcr. Stat. Ass. 2005. Vol. 100. № 472.P. 1394−1411.
- [2] Zhang L., Mykland P.A., Ait-Sakhalia Y. Op. cit.
- [3] Zhang L. y Mykland РА., Ait-Sakhalia Y. Op. cit.
- [4] 2 Никитин Я. Ю. Указ. соч.
- [5] Эльясберг П. Е. Измерительная информация: сколько ее нужно? как ее обрабатывать? М.: Наука, 1983.
- [6] Эльясберг П. Е. Указ. соч. С. 117.