Как и чем анализировать связи криптовалютных пар?

cryptosensors.info

Как анализировать взаимосвязи криптовалют? По каким законам происходит движение криптовалют? Какие особенности в движениях крипты?

Содержание:

  1. Введение.
  2. У вас с распределением — все нормально?….
  3. Добыча данных о криптовалютах. Активные криптопары.
  4. Как движется крипторынок?…
  5. Непараметрический инструмент анализа связей пар криптовалют.
  6. Заключение.

Введение

Не так давно наш мир пополнился еще одним явлением: криптовалюты. Сначала к ним относились как к инструменту который интересен лишь гикам. На сегодняшний день очевидно, что «крипта» становится системообразующей. Ее загадочность, пугающая волатильность манит все больше людей: от спекулянтов до любителей теории заговоров. Возникает естественное желание понять движение крипты. Тяга упорядочить и «разложить все по полочкам» вынуждает обращаться к инструментам обработки данных. Очень часто используются эти инструменты не совсем, мягко говоря, корректно.

Например, в потоке информации о крипторынках очень большое внимание внимание уделяется исследованию связей криптовалют. Какие криптовалюты растут / падают одновременно (имеют одинаковый вектор движения)? И…. наоборот – какие имеют обратную направленность. Ответы на эти вопросы могут обогатить инвестора в прямом смысле этого слова. Такая задача является классической задачей корреляционного анализа. Казалось бы… берем котировки криптовалют… пакет электронных таблиц. «Вжух» и готово. Но… вспоминается фраза из рекламы: «не все йогурты одинаково полезны».

Тонкости как говорят, в деталях. Дело в том, что методы расчета корреляций бывают разными. В электронных таблицах используется корреляция Пирсона, хотя именуется она просто как «корреляция». Но есть одно но. Применение корреляции Пирсона возможно только если данные, которые мы пытаемся проанализировать, имеют нормальное распределение.

У вас с распределением — все нормально?….

Вспомним, что же такое нормальное распределение. Сначала будут скучные формулы, далее занимательный пример.

Итак, одномерная случайная величина, которая соответствует нормальному распределению имеет следующую функцию плотности вероятности:

Normal distribution formula
Н

За глаза ее называют еще функцией Гаусса. Она имеет всего два параметра. Первый: µ – это математическое ожидание (среднее значение), медиана и мода распределения. Второй параметр: σ — среднеквадратичное отклонение ( σ2 — дисперсия) распределения. Функция плотности вероятности имеет следующее графическое представление:

Для того чтобы описать нормальное распределение без формул, задумаемся, например, о росте окружающих нас людей. Вспомните своих друзей, знакомых, коллег по работе. Много среди них великанов? Много ли среди них людей крайне небольшого роста? Наиболее часто встречающейся величиной, скорее всего будет «средний рост».

У нормального распределения есть еще одно замечательное свойство. Отмеряем три стандартных отклонения вниз от среднего роста. Отмеряем три стандартных отклонения вверх от среднего роста. 99.73% ваших испытуемых будут иметь рост в пределах этого диапазона. Другими словами, львиная доля выборки находится в пределах «трех сигм».

Представим теперь, что мы оказались в сказочном средневековье. Кроме людей на земле живут и другие существа: великаны, гномы. Драконы барражируют в небесах. В лесах притаились эльфы. Сформируем выборку роста сказочных существ. Как видим, гистограмма имеет тяжелые хвосты.

Почему? Все просто – встреча с гномом или великаном не такая уж и редкость. Распределения величины роста обитателей сказочного леса существенно отличается от нормального.

Особо стоит отметить, что если на случайную величину воздействуют много случайных величин, которые практически не зависимы друг от друга поведение такой случайной величины описывается нормальном распределением. Нормальное распределение довольно хорошо изучено. На нем базируется масса методик обработки данных. Корреляция Пирсона, которая требует нормальности лишь один из тысячи инструментов. И здесь возникает принципиальный вопрос. А какое распределение имеют ценовые изменения криптовалют?

Добыча данных о криптовалютах. Активные криптопары.

В качестве источника данных о парах криптовалют будем рассматривать криптобиржу Binance. В качестве средств обработки будем использовать Python 3.7.7. Задействуем такие библиотеки как: scipy,numpy,pandas,plotly.

На момент написания данного исследования мы располагаем историческими данными о 600 криптовалютных парах (Количество криптопар на Binance постоянно растет. На момент выпуска данного исследования величина была выше указанной). Будем рассматривать дневные данные. Добыча данных производится с использованием API Binance. Объем выборки — 90 дней . Предметом рассмотрения будет следующий показатель:

Growth_rate_Close = Цена закрытия текущий день / Цена закрытия предыдущий день

Т.е. если, например, данное отношение равно 1,015 — цена закрытия увеличилась на 1,5%. Если значение, например, составляет 0,98 — значит цена упала на 2%. Таким образом, анализируем не абсолютные значения цен закрытия пар криптовалют, а их приросты.

Отметим, не все пары активно торгуются. Выделим наиболее ликвидные из них. В качестве критерия активности можно выделить два — количество сделок либо объем торговли. Выберем количество сделок. Итак, если отсортировать все криптовалютные пары по количеству сделок, и вывести это на график получится следующее.

Возьмем 35 наиболее активно торгуемых криптовалют. Они отображены красным цветом на графике. Все данные о криптовалютных парах отображены синим цветом. Из графика видно, что наиболее активная часть криптовалют составляет лишь 6% от всего перечня криптовалют.

0,05833 = 35 / 600

Да, это факт. Таковы реалии крипторынка.

Как движется крипторынок?…

Как же выглядит гистограмма приростов изменения цен по этим наиболее активным 35 позициям? Как движется крипторынок? Как то так:

Тестирование на соответствие нормальному распределению производится как визуальным соответствием к графику нормального распределения так и расчетом статистик. Насколько близка эта картинка к нормальному распределению? Визуально? Сомнительно…

Дополнительно проведем тест Шапиро – Уилка. Данный тест используется для определения соответствия выборки нормальному распределению. Были получены следующие результаты:

Пара        Shapiro-Wilk        p

pair_adausdt_1d        0.9671995043754578        0.02252993

pair_ankrbtc_1d        0.9147272706031799        0.00001967

pair_ankrusdt_1d        0.943658173084259        0.00069367

pair_bttbnb_1d        0.9101758599281311        0.00001190

pair_bttbusd_1d        0.9795295000076294        0.16745451

pair_btttrx_1d        0.9735089540481567        0.06264874

pair_bttusdt_1d        0.9781306385993958        0.13348551

pair_cocosusdt_1d        0.9613599181175232        0.00900380

pair_denteth_1d        0.9790965914726257        0.15614410

pair_dentusdt_1d        0.9696356058120728        0.03333539

pair_dogeusdt_1d        0.9118067026138306        0.00001422

pair_hotbtc_1d        0.8912015557289124        0.00000167

pair_hoteth_1d        0.9076758027076721        0.00000907

pair_hotusdt_1d        0.9536965489387512        0.00285049

pair_iostbtc_1d        0.9279756546020508        0.00009242

pair_iostusdt_1d        0.9479432702064514        0.00125220

pair_keyusdt_1d        0.6302748918533325        0.00000000

pair_maticusdt_1d        0.9804877638816833        0.19529814

pair_mblusdt_1d        0.9175736904144287        0.00002714

pair_mftusdt_1d        0.8282192349433899        0.00000001

pair_npxseth_1d        0.8064180612564087        0.00000000

pair_npxsusdt_1d        0.7406529188156128        0.00000000

pair_onebtc_1d        0.9784880876541138        0.14147447

pair_oneusdt_1d        0.9795064926147461        0.16683325

pair_scbtc_1d        0.9732644557952881        0.06019074

pair_trxbtc_1d        0.8679629564285278        0.00000019

pair_trxusdt_1d        0.9682722687721252        0.02675677

pair_vetbtc_1d        0.986322283744812        0.47012007

pair_vetusdt_1d        0.9671380519866943        0.02230977

pair_vthousdt_1d        0.9375638961791992        0.00030876

pair_winbnb_1d        0.9504895210266113        0.00179445

pair_wintrx_1d        0.9059931635856628        0.00000758

pair_winusdc_1d        0.9044052362442017        0.00000641

pair_winusdt_1d        0.908967137336731        0.00001043

pair_zilusdt_1d        0.9742823839187622        0.07111172

Лишь 10 криптопар из 35 имеют p, который оказался выше чем уровень alpha Шапиро–Уилка. Это значит что технически мы не можем отвергнуть гипотезу о том что выборки распределены нормально. Вот как выглядит гистограмма упомянутых 10 криптопар:

Насколько их вид соответствует нормальному распределению? Не смотря на значения статистики Шапиро–Уилка, очень сомнительно. И справа и слева заметны утолщенные хвосты. Вспомним о гномах и великанах 😉

Криптовалютные пары не живут по законам нормального распределения! Данный факт имеет важное следствие. Необходимо использовать такие инструменты анализа, которые были бы свободны от вида распределения. Речь идет о непараметрической статистике. И… исследование взаимосвязей там также возможно!

Непараметрический инструмент анализа связей пар криптовалют

Непараметрическим аналогом коэффициента Пирсона является коэффициент Спирмена. Вообще его расчет относится к методам ранговой корреляции. Но… ранговая корреляция применима и к вещественным переменным. Рассчитывая коэффициент Спирмена между парами криптовалют в каждом случае мы получим два значения: непосредственно сам коэффициент, а также величину p, которая позволяет оценить уровень значимости самого коэффициента Спирмена.

На момент проведения исследования мы выявили лишь 35 пар инструментов где присутствует интересная и статистически значимая связь. Почему здесь применяется термин интересная? Не сильная… не слабая? Потому как величина корреляции это не единственный параметр который говорит о том, насколько взаимосвязь интересна с точки зрения получения прибыли. Вы можете ознакомиться с исследованием «Индикаторы-поводыри в торговле криптовалютами или эффект Трумана в действии. Слабые корреляции на вооружении трейдера.» на www.cryptosensors.info, которое расскажет о нюансах исследования взаимосвязей.

Рынок криптовалют изменчив, но… наши программные обработки мониторинга работают с ним. Узнать о том, какие существуют взаимосвязи между криптовалютными парами на данное время (речь идет не о времени написания этих строк; а о времени когда вы читаете эти строки) вы можете на www.cryptosensors.info.

Заключение

Криптовалютные пары живут не по законам нормального распределения. Выбирая инструмент для анализа связей криптовалют необходимо пользоваться правильным инструментом. Коэффициент корреляции Спирмена может использоваться для анализа крипторынка, поскольку является непараметрическим критерием.

Возможно вам будут интересны исследования / данные: