applied_statistics

Форк
0
/
Lecture 1. Stats Intro.ipynb 
1522 строки · 253.5 Кб
1
{
2
 "cells": [
3
  {
4
   "cell_type": "markdown",
5
   "id": "c63339f0",
6
   "metadata": {},
7
   "source": [
8
    "# Лекция 1. Введение в статистику."
9
   ]
10
  },
11
  {
12
   "cell_type": "code",
13
   "execution_count": 3,
14
   "id": "d5f9414c",
15
   "metadata": {},
16
   "outputs": [],
17
   "source": [
18
    "from scipy.stats import (\n",
19
    "    binom\n",
20
    ")\n",
21
    "import numpy as numpy\n",
22
    "from seaborn import distplot\n",
23
    "from matplotlib import pyplot\n",
24
    "import seaborn\n",
25
    "import random\n",
26
    "\n",
27
    "import sys\n",
28
    "sys.path.append('.')"
29
   ]
30
  },
31
  {
32
   "cell_type": "code",
33
   "execution_count": 4,
34
   "id": "c51ca343",
35
   "metadata": {},
36
   "outputs": [],
37
   "source": [
38
    "def inverse_plot_colorscheme():\n",
39
    "    import cycler\n",
40
    "    def invert(color_to_convert): \n",
41
    "        table = str.maketrans('0123456789abcdef', 'fedcba9876543210')\n",
42
    "        return '#' + color_to_convert[1:].lower().translate(table).upper()\n",
43
    "    update_dict = {}\n",
44
    "    for key, value in pyplot.rcParams.items():\n",
45
    "        if value == 'black':\n",
46
    "            update_dict[key] = 'white'\n",
47
    "        elif value == 'white':\n",
48
    "            update_dict[key] = 'black'\n",
49
    "    \n",
50
    "    old_cycle = pyplot.rcParams['axes.prop_cycle']\n",
51
    "    new_cycle = []\n",
52
    "    for value in old_cycle:\n",
53
    "        new_cycle.append({\n",
54
    "            'color': invert(value['color'])\n",
55
    "        })\n",
56
    "    pyplot.rcParams.update(update_dict)\n",
57
    "    pyplot.rcParams['axes.prop_cycle'] = cycler.Cycler(new_cycle)\n",
58
    "    lec = pyplot.rcParams['legend.edgecolor']\n",
59
    "    lec = str(1 - float(lec))\n",
60
    "    pyplot.rcParams['legend.edgecolor'] = lec"
61
   ]
62
  },
63
  {
64
   "cell_type": "code",
65
   "execution_count": 5,
66
   "id": "ea72839f",
67
   "metadata": {},
68
   "outputs": [],
69
   "source": [
70
    "inverse_plot_colorscheme()"
71
   ]
72
  },
73
  {
74
   "cell_type": "markdown",
75
   "id": "b8ea1909",
76
   "metadata": {},
77
   "source": [
78
    "______\n",
79
    "\n",
80
    "В этой лекции мы начинаем знакомство с математической статистикой. На примере бизнес-задачи мы разберём, зачем нужна статистика, как применить её к конкретной задаче и какие ошибки можно совершить, если не пользоваться математическим аппаратом."
81
   ]
82
  },
83
  {
84
   "cell_type": "markdown",
85
   "id": "9c485fca",
86
   "metadata": {},
87
   "source": [
88
    "## Часть 1. Зачем нужна прикладная статистика\n",
89
    "\n",
90
    "Предположим, вы придумали идею для стартапа. Вы договорились с магазинами одежды об осуществлении доставки и наняли курьеров, которые собирают из магазинов заказы и доставляют клиентам. Предположим, доставка в вашем сервисе стоит 1000 рублей, а курьеру за работу требуется заплатить 500 рублей. Казалось бы, прибыль очевидна, но внезапно вы понимаете, что от одежды часто отказываются, если она не подходит. Это понимают и ваши инвесторы, которых вы просите помочь с рекламой и инфраструктурой. Они согласны помогать вам, если шанс отказа будет меньше 50%.\n",
91
    "\n",
92
    "**Как вам убедить инвесторов?**\n",
93
    "\n",
94
    "Вы решаетесь на эксперимент. Самостоятельно находите $30$ клиентов и доставляете им заказы через курьеров. Оплачивают покупку $19$ из них, остальные отказываются. $19$ — это больше половины покупателей, но достаточно ли этого, чтобы доказать успешность вашего бизнеса?\n",
95
    "\n",
96
    "### Модель и наблюдения\n",
97
    "\n",
98
    "Решая такую задачу, мы предполагаем, что есть аудитория, которая воспользуется нашим сервисом. Она называется *генеральной совокупностью*. Если мы запустим сервис на всех пользователей, то в нём будет доля успешных доставок, обозначим её $\\mu$. Это некоторый параметр, который мы не знаем. Всё, что мы можем делать — это проводить эксперименты и *наблюдать*. Мы не можем протестировать продукт на всех, но можем собрать *выборку* из генеральной совокупности и пронаблюдать долю успехов. По проведённому эксперименту видим, что наблюдаемая вероятность оплаты $\\frac{19}{30} = 63\\%$.\n",
99
    "\n",
100
    "Но до сих пор неясно, является ли это доказательством, что истинное $\\mu > 50\\%$.\n",
101
    "\n",
102
    "Посмотрим, почему это может не быть доказательством. Положим вероятность $\\mu = 0.5$ и математически смоделируем, какие могли быть статусы наших 30 заказов.\n",
103
    "\n",
104
    "**Алгоритм моделирования**\n",
105
    "\n",
106
    "- Так как вероятность успеха 0.5, можно подбросить монетку для моделирования того, был ли успех\n",
107
    "- Чтобы подбросить монетку, воспользуемся функцией `random.randint`, которая возвращает случайное целое число из диапазона, в нашем случае от 0 до 1, где 1 означает успешную доставку\n",
108
    "- Подкинем монетку 30 раз, чтобы получить результаты 30 доставок"
109
   ]
110
  },
111
  {
112
   "cell_type": "code",
113
   "execution_count": 6,
114
   "id": "22de314c",
115
   "metadata": {},
116
   "outputs": [],
117
   "source": [
118
    "# фиксируем последовательность рандома для воспроизводимости\n",
119
    "random.seed(20000)"
120
   ]
121
  },
122
  {
123
   "cell_type": "code",
124
   "execution_count": 7,
125
   "id": "16f34269",
126
   "metadata": {},
127
   "outputs": [],
128
   "source": [
129
    "statuses = []\n",
130
    "for _ in range(30):  # моделируем 30 доставок\n",
131
    "    status = random.randint(0, 1)  # генерируем случайное число, 0 или 1\n",
132
    "    statuses.append(status)\n",
133
    "exp_chance = sum(statuses) / 30  # доля успехов"
134
   ]
135
  },
136
  {
137
   "cell_type": "code",
138
   "execution_count": 8,
139
   "id": "1245534d",
140
   "metadata": {},
141
   "outputs": [
142
    {
143
     "name": "stdout",
144
     "output_type": "stream",
145
     "text": [
146
      "Доля успехов: 67%\n"
147
     ]
148
    }
149
   ],
150
   "source": [
151
    "print('Доля успехов: {:.0%}'.format(exp_chance))"
152
   ]
153
  },
154
  {
155
   "cell_type": "markdown",
156
   "id": "93b90abc",
157
   "metadata": {},
158
   "source": [
159
    "Видим, что в эксперименте доля успешных заказов была даже выше $63\\%$, но модельная вероятность была $50\\%$.\n",
160
    "\n",
161
    "Поэтому, к сожалению, **точно сказать, какой является $\\mu$ в генеральной совокупности, и больше ли она 50%, нельзя**, сколько бы мы ни наблюдали за доставками. Но с помощью прикладной статистики мы введём аппарат, который позволяет принять правильное продуктовое решение, в том числе и для этой задачи. "
162
   ]
163
  },
164
  {
165
   "cell_type": "markdown",
166
   "id": "622e27cc",
167
   "metadata": {},
168
   "source": [
169
    "## Часть 2. Статистические гипотезы"
170
   ]
171
  },
172
  {
173
   "cell_type": "markdown",
174
   "id": "188d64ff",
175
   "metadata": {},
176
   "source": [
177
    "Мы увидели, что можно получить довольно много успехов даже в случае вероятности $\\mu = 0.5$. Но на самом деле для этого пришлось подбирать seed. Если перезапустить только ячейку с экспериментом, доля успехов получится уже меньше половины! Так может быть большая доля успехов случается очень редко, и мы готовы принять большое в качестве доказательства?\n",
178
    "\n",
179
    "Чтобы это понять, надо ответить на вопрос:\n",
180
    "\n",
181
    "❓ **Насколько часто может быть такое, что при $\\mu = 0.5$ получается большая доля успехов**?\n",
182
    "\n",
183
    "Для этого обратимся к теории вероятностей. Успешность каждого заказа — это случайная величина $\\xi$ из распределения Бернулли. Параметр этого распределения, вероятность успеха, мы не знаем."
184
   ]
185
  },
186
  {
187
   "cell_type": "markdown",
188
   "id": "b505d998",
189
   "metadata": {},
190
   "source": [
191
    "$$ \\xi = \\xi_1, \\xi_2, \\dots, \\xi_{30} \\sim Bern(\\mu) - \\text{выборка} $$\n",
192
    "\n",
193
    "$$ \\mu - \\text{неизвестный параметр} $$\n",
194
    "\n",
195
    "### Гипотеза\n",
196
    "\n",
197
    "При этом у нас есть продуктовая гипотеза о том, как устроено распределение в генеральной совокупности. Нас интересует доказательство того, что $\\mu > 0.5$. В механизме проверки гипотез в статистике рассматривают две гипотезы. Нулевая гипотеза говорит о том, что мы хотим опровергнуть. Альтернативная гипотеза говорит о том, что мы хотим доказать.\n",
198
    "\n",
199
    "$$ \\mathsf{H}_0: \\mu = 0.5 $$\n",
200
    "$$ \\mathsf{H}_1: \\mu > 0.5 $$\n"
201
   ]
202
  },
203
  {
204
   "cell_type": "markdown",
205
   "id": "a798c575",
206
   "metadata": {},
207
   "source": [
208
    "Заметим, что если в эксперименте $30$ доставок, то можно смотреть не на долю успехов, а просто на количество. Переформулируем вопрос:\n",
209
    "\n",
210
    "❓ **Насколько часто может быть такое, что при справедливости $\\mathsf{H}_0$ получается большое количество успехов**?\n",
211
    "\n",
212
    "Количество успехов — это сумма независимых бернуллиевских величин, значит имеет биномиальное распределение. Посмотрим, как оно выглядит."
213
   ]
214
  },
215
  {
216
   "attachments": {
217
    "success_distr.png": {
218
     "image/png": ""
219
    }
220
   },
221
   "cell_type": "markdown",
222
   "id": "b95b64e5",
223
   "metadata": {},
224
   "source": [
225
    "![success_distr.png](attachment:success_distr.png)"
226
   ]
227
  },
228
  {
229
   "cell_type": "markdown",
230
   "id": "1ffb0c22",
231
   "metadata": {},
232
   "source": [
233
    "Видим, например, что $20$ и более успехов случаются достаточно редко. Для принятия решения можно пользоваться правилом `инвестируем, если успехов хотя бы 20`. Если $\\mathsf{H}_0$ и верна, то ошибаться, используя это правило, мы будем редко."
234
   ]
235
  },
236
  {
237
   "cell_type": "markdown",
238
   "id": "1e47d00f",
239
   "metadata": {},
240
   "source": [
241
    "### Критерий\n",
242
    "\n",
243
    "Только что мы придумали алгоритм, который по выборке $\\xi$ либо признаёт, что мы нашли доказательство в пользу $\\mathsf{H}_1$, либо говорит, что его не нашли. Соответственно будет либо **отвергать $\\mathsf{H}_0$**, либо **не отвергать**.\n",
244
    "\n",
245
    "Такой алгоритм называется **критерием**. Представим его как функцию $S$, которая принимает реализацию выборки и возвращает $1$, если нужно отвергнуть $\\mathsf{H}_0$, и $0$ иначе.\n",
246
    "\n",
247
    "$$\n",
248
    "S(\\xi) = \\begin{cases}\n",
249
    "    1, \\text{ если отвергаем } \\mathsf{H}_0 \\\\\n",
250
    "    0, \\text{ иначе}\n",
251
    "\\end{cases}\n",
252
    "$$\n",
253
    "\n",
254
    "Запишем правило, которое сформулировали выше для нашей задачи:\n",
255
    "\n",
256
    "$$\n",
257
    "S(\\xi) = \\begin{cases}\n",
258
    "    1, \\text{ если } \\sum \\xi_i \\geqslant 20 \\\\\n",
259
    "    0, \\text{ иначе}\n",
260
    "\\end{cases}\n",
261
    "$$\n",
262
    "\n",
263
    "Обычно сокращают запись и пишут просто правило, по которому отвергаем $\\mathsf{H}_0$\n",
264
    "\n",
265
    "$$ S = \\{\\sum \\xi_i \\geqslant 20\\} $$\n",
266
    "\n",
267
    "Обозначим $Q = \\sum \\xi_i$, $С = 20$, тогда критерий принимает вид\n",
268
    "\n",
269
    "$$ S = \\{Q(\\xi) \\geqslant C\\} $$\n",
270
    "\n",
271
    "Так устроено большинство классических критериев в прикладной статистике, поэтому величинам в нём даны специальные названия. $Q$ называется **статистикой критерия**, $C$ — **критическим значением**.\n",
272
    "\n",
273
    "$Q$ может быть любой функцией от выборки, которую вы считаете логичной для проверки гипотезы. В нашем случае это количество успехов, или сумма всех $\\xi_i$. Но вы можете выбрать и другие: максимальное значение, сумму первых 5 значений или даже просто первый элемент."
274
   ]
275
  },
276
  {
277
   "cell_type": "markdown",
278
   "id": "565e4d5b",
279
   "metadata": {},
280
   "source": [
281
    "### Поиск критического значения\n",
282
    "\n",
283
    "Снова перепишем наш основной вопрос, только теперь с использованием нашего критерия $S$:\n",
284
    "\n",
285
    "❓ **Насколько часто может быть такое, что при справедливости $\\mathsf{H}_0$ критерий $S$ отвергает гипотезу**?\n",
286
    "\n",
287
    "Ответ на этот вопрос зависит от критического значения. Сейчас мы взяли его равным $20$, увидев на картинке, что большие отклонения происходят при $\\mathsf{H}_0$ редко. Но что значит редко и насколько редко, не сказали. Теперь наша цель понять, как выбрать критическое значение $C$, исходя из частоты ошибок нашего критерия.\n",
288
    "\n",
289
    "Выбирая $C$, мы можем либо часто отвергать нулевую гипотезу, когда $C$ мало, либо можем делать это реже, когда $C$ большое. Чтобы выбрать правильное значение, нужно определиться, когда наш критерий ошибается.\n",
290
    "\n",
291
    "**C = 16**\n",
292
    "\n",
293
    "Если отвергать гипотезу при получении хотя бы 16 успешных доставок из 30, то это вряд ли устроит инвесторов. Да, успехов больше половины. Но если в генеральной совокупности вероятность 0.5, то почти в половине случаев мы будем отвергать гипотезу. Критерий ошибочно возвращает $1$, то есть это ошибка **False Positive**.\n",
294
    "\n",
295
    "**C = 29**\n",
296
    "\n",
297
    "В таком случае будем отвергать гипотезу только при 29 или 30 успехах. Эти значения, конечно, говорят о том, что отклонение от 50% успехов сильное. Но если в генеральной совокупности вероятность, к примеру, 60%, то такие значения будут получаться редко. А ведь такие вероятности тоже устроили бы инвесторов, и мы бы смогли открыть стартап! А с таким критерием мы вряд ли добьёмся этого. Не отвергнуть гипотезу $\\mathsf{H}_0$, когда она неверна - это тоже ошибка. Она называется **False Negative**, так как критерий вернул 0 ошибочно.\n",
298
    "\n",
299
    "$$ \\text{False Positive (FP) } - \\mathsf{H}_0\\ отвергается,\\ когда\\ она\\ верна $$\n",
300
    "$$ \\text{False Negative (FN) } - \\mathsf{H}_0\\ не\\ отвергается,\\ когда\\ она\\ не верна $$\n",
301
    "\n",
302
    "В нашей задаче инвесторам важнее False Positive. Им очень не хочется попасть в ситуацию, когда им показали доказательство успешности бизнеса, а оказалось, что от большинства заказов отказываются, и компания не получает прибыль. Это приведёт к убыткам. False Negative же приведет к тому, что вы упустите успешный бизнес, но инвесторы денег не потеряют.\n",
303
    "\n",
304
    "Поэтому выберем порог, чтобы была удовлетворительной вероятность False Positive, или же False Positive Rate (FPR). Для этого надо понять, как часто мы будем отвергать гипотезу, когда верна $\\mathsf{H}_0$.\n",
305
    "\n",
306
    "Теперь снова переформулируем основной вопрос, полностью с использованием новых терминов, и наконец ответим на него.\n",
307
    "\n",
308
    "❓ **Какой FPR у критерия S для проверки гипотезы $\\mathsf{H}_0$ vs $\\mathsf{H}_1$**?\n",
309
    "\n",
310
    "Вспомним моделирование из части 1. Когда $\\mathsf{H}_0$ верна, чтобы посчитать количество успехов мы проводили $30$ раз подбрасывание монетки с вероятностью орла $0.5$. Количество орлов (то есть успехов) в таком эксперименте имеет распределение, которое называется биномиальным, то есть при $\\mu = 0.5$ наша статистика имеет биномиальное распределение $Q \\sim Binom(0.5, 30)$.\n",
311
    "\n",
312
    "Вычислим FPR для $C = 20$\n",
313
    "\n",
314
    "$$ FPR = P(S(\\xi) = 1\\ |\\  \\mathsf{H}_0) = P(Q \\geqslant 20\\ |\\ \\mathsf{H}_0) = P(Q \\geqslant 20\\ |\\ \\mu = 0.5) = $$\n",
315
    "\n",
316
    "$$ = P(Q \\geqslant 20\\ |\\ Q \\sim Binom(0.5, 30)) $$\n",
317
    "\n",
318
    "Это уже вероятность события при конкретном распределении случайной величины. Его можно посмотреть по таблице или, что удобнее, вычислить в Python. Работе с распределениями в Python будет посвящена часть 3.\n",
319
    "\n",
320
    "$$ FPR \\approx 0.049 $$\n",
321
    "\n",
322
    "Если False Positive Rate не превышает некоторой константы $\\alpha$, то критерий называется критерием **уровня значимости** $\\alpha$. В прикладной статистике мы никогда не ставим задачу в формулировке \"создать статистический критерий\", а ставим только в формулировке \"создать статистический критерий уровня значимости \"$\\alpha$\". Статистический критерий с $\\alpha$ = 100% создать тривиально — достаточно всегда отвергать $H_0$ — поэтому такая постановка не имеет смысла.\n",
323
    "\n",
324
    "Уровень значимости обычно выбирается на основе бизнес-соображений. Он обозначает то, какой риск неправильного принятия положительного решения мы считаем приемлемым. Обычно берут $\\alpha = 0.05$, но если требуется более точное принятие решения, могут выбрать $0.01$, $0.005$, $0.001$. Если же решение не так критично, могут выбрать $0.1$.\n",
325
    "\n",
326
    "Предположим, выбрали значение $\\alpha = 0.05$, тогда наш критерий подходит для принятия решений. Воспользуемся критерием $S$: в нашем случае у нас всего лишь $19$ успехов, а значит гипотезу $\\mathsf{H}_0$ мы не отвергаем."
327
   ]
328
  },
329
  {
330
   "cell_type": "markdown",
331
   "id": "78a2abfb",
332
   "metadata": {},
333
   "source": [
334
    "## Часть 3. Статистические функции в Python\n",
335
    "\n",
336
    "В этой части посмотрим, как вывести то, что мы получили в части 2, с помощью Python. А также поймём, как найти подходящее $C$ с помощью Python."
337
   ]
338
  },
339
  {
340
   "cell_type": "markdown",
341
   "id": "1e6b331a",
342
   "metadata": {},
343
   "source": [
344
    "### Биномиальное распределение\n",
345
    "\n",
346
    "Мы выяснили, что статистика $Q$ имеет биномиальное распределение.\n",
347
    "\n",
348
    "Биномиальное распределение $Binom(n, \\mu)$ — распределение количества успехов в последовательности из $n$ независимых случайных экспериментов, вероятность успеха в каждом из которых равна $\\mu$.\n",
349
    "\n",
350
    "Чтобы работать с распределением, можно создать объект-распределение с помощью библиотеки `scipy.stats`."
351
   ]
352
  },
353
  {
354
   "cell_type": "code",
355
   "execution_count": 10,
356
   "id": "539575d3",
357
   "metadata": {},
358
   "outputs": [],
359
   "source": [
360
    "binom_h0 = binom(\n",
361
    "    n=30, # количество испытаний\n",
362
    "    p=0.5 # вероятность успеха\n",
363
    ")"
364
   ]
365
  },
366
  {
367
   "cell_type": "markdown",
368
   "id": "af0fb4aa",
369
   "metadata": {},
370
   "source": [
371
    "### Функция вероятности\n",
372
    "\n",
373
    "Функция вероятности дискретного распределения $p_\\xi(x)$ — вероятность, с которой $\\xi$ принимает значение $x$.\n",
374
    "\n",
375
    "В Python это функция `pmf` (probability mass function)"
376
   ]
377
  },
378
  {
379
   "cell_type": "code",
380
   "execution_count": 11,
381
   "id": "d80e9bba",
382
   "metadata": {},
383
   "outputs": [
384
    {
385
     "data": {
386
      "text/plain": [
387
       "0.027981600724160505"
388
      ]
389
     },
390
     "execution_count": 11,
391
     "metadata": {},
392
     "output_type": "execute_result"
393
    }
394
   ],
395
   "source": [
396
    "binom_h0.pmf(10)"
397
   ]
398
  },
399
  {
400
   "cell_type": "markdown",
401
   "id": "1f57e1f4",
402
   "metadata": {},
403
   "source": [
404
    "Изобразим распределение статистики $Q$ при справедливости $\\mathsf{H}_0$ на графике. Для этого можно передать сразу массив точек, для которых надо рассчитать вероятность."
405
   ]
406
  },
407
  {
408
   "cell_type": "code",
409
   "execution_count": 12,
410
   "id": "2d335713",
411
   "metadata": {},
412
   "outputs": [],
413
   "source": [
414
    "# координата\n",
415
    "x_grid = numpy.arange(1, 31)\n",
416
    "# высота столбцов на графике\n",
417
    "probs = binom_h0.pmf(x_grid)"
418
   ]
419
  },
420
  {
421
   "cell_type": "code",
422
   "execution_count": 13,
423
   "id": "b50f4e82",
424
   "metadata": {},
425
   "outputs": [
426
    {
427
     "data": {
428
      "image/png": "\n",
429
      "text/plain": [
430
       "<Figure size 1152x576 with 1 Axes>"
431
      ]
432
     },
433
     "metadata": {
434
      "needs_background": "dark"
435
     },
436
     "output_type": "display_data"
437
    }
438
   ],
439
   "source": [
440
    "pyplot.figure(figsize=(16, 8))\n",
441
    "\n",
442
    "# строим вертикальные столбцы от 0 до вероятности\n",
443
    "pyplot.vlines(x_grid, 0, probs, linewidth=15.0, color='white', label='PMF, $Binom(0.5, 30)$')\n",
444
    "# отдельно изобразим критическую области критерия\n",
445
    "crit_reg = x_grid >= 20\n",
446
    "pyplot.vlines(x_grid[crit_reg], 0, probs[crit_reg], linewidth=15.0, label='Critical region for S')\n",
447
    "\n",
448
    "pyplot.title('Binomial distribution', fontsize=20)\n",
449
    "pyplot.legend(fontsize=18)\n",
450
    "pyplot.show()"
451
   ]
452
  },
453
  {
454
   "cell_type": "markdown",
455
   "id": "742866be",
456
   "metadata": {},
457
   "source": [
458
    "На самом деле уже сейчас мы можем посчитать вероятность попадания в критическую область. Нужно просто просуммировать высоты оранжевых столбцов."
459
   ]
460
  },
461
  {
462
   "cell_type": "code",
463
   "execution_count": 14,
464
   "id": "6624434e",
465
   "metadata": {},
466
   "outputs": [
467
    {
468
     "data": {
469
      "text/plain": [
470
       "0.04936857335269421"
471
      ]
472
     },
473
     "execution_count": 14,
474
     "metadata": {},
475
     "output_type": "execute_result"
476
    }
477
   ],
478
   "source": [
479
    "numpy.sum(probs[crit_reg])"
480
   ]
481
  },
482
  {
483
   "cell_type": "markdown",
484
   "id": "bfcc9f59",
485
   "metadata": {},
486
   "source": [
487
    "Получаем то число, которое было в части 2. Значит мы действительно построили критерий уровня значимости $\\alpha = 0.05$. Более того, это критерий уровня значимости $0.0494$, но такую точность обычно не используют.\n",
488
    "\n",
489
    "А что если бы мы взяли $C = 19?$"
490
   ]
491
  },
492
  {
493
   "cell_type": "code",
494
   "execution_count": 15,
495
   "id": "b390f8cc",
496
   "metadata": {},
497
   "outputs": [
498
    {
499
     "data": {
500
      "text/plain": [
501
       "0.10024421103298595"
502
      ]
503
     },
504
     "execution_count": 15,
505
     "metadata": {},
506
     "output_type": "execute_result"
507
    }
508
   ],
509
   "source": [
510
    "crit_reg = x_grid >= 19\n",
511
    "numpy.sum(probs[crit_reg])"
512
   ]
513
  },
514
  {
515
   "cell_type": "markdown",
516
   "id": "f5b03413",
517
   "metadata": {},
518
   "source": [
519
    "Тогда вероятность ошибки уже даже больше $10\\%$, что совсем нам не подходит. Видно, что нет такого $C$, чтобы False Positive Rate был ровно $5\\%$."
520
   ]
521
  },
522
  {
523
   "cell_type": "markdown",
524
   "id": "e4e30701",
525
   "metadata": {},
526
   "source": [
527
    "### Кумулятивная функция распределения"
528
   ]
529
  },
530
  {
531
   "cell_type": "markdown",
532
   "id": "9b88f8bf",
533
   "metadata": {},
534
   "source": [
535
    "Кумулятивная функция распределения $F_\\xi(x) = P(\\xi \\leqslant x)$\n",
536
    "\n",
537
    "В Python это функция `cdf` (cumulative distribution function)"
538
   ]
539
  },
540
  {
541
   "cell_type": "code",
542
   "execution_count": 13,
543
   "id": "cf5fb44d",
544
   "metadata": {},
545
   "outputs": [
546
    {
547
     "data": {
548
      "text/plain": [
549
       "0.9506314266473055"
550
      ]
551
     },
552
     "execution_count": 13,
553
     "metadata": {},
554
     "output_type": "execute_result"
555
    }
556
   ],
557
   "source": [
558
    "binom_h0.cdf(19)"
559
   ]
560
  },
561
  {
562
   "cell_type": "markdown",
563
   "id": "73561795",
564
   "metadata": {},
565
   "source": [
566
    "По строчке выше понятно, что вероятность получить $19$ или меньше успехов в нашей задаче $\\geqslant 0.95$. А поскольку $P(\\xi \\leqslant 19) + P(\\xi \\geqslant 20) = 1$, можем вычислить уровень значимости нашего критерия."
567
   ]
568
  },
569
  {
570
   "cell_type": "code",
571
   "execution_count": 14,
572
   "id": "d36dd3cf",
573
   "metadata": {},
574
   "outputs": [
575
    {
576
     "data": {
577
      "text/plain": [
578
       "0.04936857335269451"
579
      ]
580
     },
581
     "execution_count": 14,
582
     "metadata": {},
583
     "output_type": "execute_result"
584
    }
585
   ],
586
   "source": [
587
    "1 - binom_h0.cdf(19)"
588
   ]
589
  },
590
  {
591
   "cell_type": "markdown",
592
   "id": "e0667c0b",
593
   "metadata": {},
594
   "source": [
595
    "### Квантиль\n",
596
    "\n",
597
    "Чтобы выбрать критическую область для критерия, мы хотели бы найти точку, площадь столбцов справа от которой была бы $5\\%$. То есть площадь столбцов слева &mdash; $95\\%$. Такая точка называется *квантилью*.\n",
598
    "\n",
599
    "$$ u_p(\\xi) = \\{x\\ | F_\\xi(x) = p\\} $$\n",
600
    "\n",
601
    "Но при $p = 0.95$ и нашем биномиальном распределении, такой точки нет. Мы выяснили, что есть точка, справа от которой площадь $0.494$, а у следующей уже $0.1$. Чтобы определить квантиль в этом случае, модифицируем определение:\n",
602
    "\n",
603
    "Квантиль $Quantile_p(\\xi) = u_p(\\xi) = min\\ \\{x\\ |\\ F_\\xi(x) \\geqslant p \\}$ &mdash; величина, которую $\\xi$ не превышает с вероятностью хотя бы $p$.\n",
604
    "\n",
605
    "**Пример**\n",
606
    "\n",
607
    "Для величины $\\xi \\sim Bin(30, 0.5)$ посчитаем 0.95-квантиль. Решим задачу просто подбором.\n",
608
    "\n",
609
    "$$ P(\\xi \\leqslant 18) \\approx 0.90$$\n",
610
    "$$ P(\\xi \\leqslant 19) \\approx 0.951 $$\n",
611
    "$$ P(\\xi \\leqslant 20) \\approx 0.97 $$\n",
612
    "\n",
613
    "Видим, что 18 нам ещё не подходит, а 19 и большие значение уже подойдут. В них функция распределения будет больше $p$. Ответ - наименьшее подходящее значение, то есть 19. При этом нет точки, где функция распределения была бы равна $p$ в точности.\n",
614
    "\n",
615
    "\n",
616
    "Если бы распределение было непрерывное, можно было бы сказать, что квантиль &mdash; такое $x$, на котором функция распределения равна $p$. Но в прошлом пункте увидели, что для дискретного распределения такого может не быть.\n",
617
    "\n",
618
    "В Python квантиль можно посчитать через функцию `ppf` (percent point function)"
619
   ]
620
  },
621
  {
622
   "cell_type": "code",
623
   "execution_count": 15,
624
   "id": "8a510e8a",
625
   "metadata": {},
626
   "outputs": [
627
    {
628
     "data": {
629
      "text/plain": [
630
       "19.0"
631
      ]
632
     },
633
     "execution_count": 15,
634
     "metadata": {},
635
     "output_type": "execute_result"
636
    }
637
   ],
638
   "source": [
639
    "binom_h0.ppf(0.95)"
640
   ]
641
  },
642
  {
643
   "cell_type": "markdown",
644
   "id": "b73c4ba8",
645
   "metadata": {},
646
   "source": [
647
    "Как теперь подобрать $C$ для любых $n, \\mu$ и для любого уровня значимости $\\alpha$?\n",
648
    "\n",
649
    "1. Требуется найти $C$, такое что $P(Q \\geqslant C) \\leqslant \\alpha$\n",
650
    "2. То есть требуется $P(Q < C) \\geqslant 1 - \\alpha$\n",
651
    "3. Q принимает только целые значения: $P(Q \\leqslant C - 1) \\geqslant 1 - \\alpha$, или $F(C - 1) \\geqslant 1 - \\alpha$\n",
652
    "4. Значит, из определения квантили, $C - 1 = u_{1 - \\alpha}$\n",
653
    "5. Значит $C = u_{1 - \\alpha} + 1$"
654
   ]
655
  },
656
  {
657
   "cell_type": "code",
658
   "execution_count": 16,
659
   "id": "8172ba96",
660
   "metadata": {},
661
   "outputs": [],
662
   "source": [
663
    "def make_binom_criterion(n, mu=0.5, alpha=0.05):\n",
664
    "    '''Строит критерий для задачи с доставкой\n",
665
    "    \n",
666
    "    Параметры:\n",
667
    "        n: количество доставок в эксперименте\n",
668
    "        mu: вероятность успеха в нулевой гипотезе\n",
669
    "        alpha: уровень значимости критерия\n",
670
    "        \n",
671
    "    Возвращает:\n",
672
    "        C для критерия S = {Q >= C}\n",
673
    "    '''\n",
674
    "    binom_h0 = binom(n=n, p=mu)\n",
675
    "    q = binom_h0.ppf(1 - alpha)\n",
676
    "    return q + 1"
677
   ]
678
  },
679
  {
680
   "cell_type": "markdown",
681
   "id": "e28b2164",
682
   "metadata": {},
683
   "source": [
684
    "Применим к нашей постановке"
685
   ]
686
  },
687
  {
688
   "cell_type": "code",
689
   "execution_count": 17,
690
   "id": "2794ac11",
691
   "metadata": {},
692
   "outputs": [
693
    {
694
     "name": "stdout",
695
     "output_type": "stream",
696
     "text": [
697
      "if Q >= 20.0 then reject H0\n"
698
     ]
699
    }
700
   ],
701
   "source": [
702
    "print(f'if Q >=', make_binom_criterion(\n",
703
    "    n=30,\n",
704
    "    mu=0.5,\n",
705
    "    alpha=0.05\n",
706
    "), 'then reject H0')"
707
   ]
708
  },
709
  {
710
   "cell_type": "markdown",
711
   "id": "29055110",
712
   "metadata": {},
713
   "source": [
714
    "Критическое значение $20$, значит итоговый критерий выглядит так\n",
715
    "\n",
716
    "$$ S = \\{Q \\geqslant 20\\} $$\n",
717
    "\n",
718
    "\n",
719
    "$Q = 19$, значит гипотезу мы не отвергаем.\n",
720
    "\n",
721
    "При этом нам удалось построить процесс, по которому мы принимаем решение для любого уровня значимости и значения статистики критерия."
722
   ]
723
  },
724
  {
725
   "cell_type": "markdown",
726
   "id": "24a5dcb6",
727
   "metadata": {},
728
   "source": [
729
    "## Часть 4. p-value"
730
   ]
731
  },
732
  {
733
   "cell_type": "markdown",
734
   "id": "482918e1",
735
   "metadata": {},
736
   "source": [
737
    "Заметим, что сейчас, если нам зададут другую $\\alpha$, нам придётся перестраивать критерий заново. Это не совсем удобно. В статистике есть механизм *p-value*, который позволяет принять решения для всех $\\alpha$ сразу."
738
   ]
739
  },
740
  {
741
   "cell_type": "markdown",
742
   "id": "3190870e",
743
   "metadata": {},
744
   "source": [
745
    "### Более экстремальные значения\n",
746
    "\n",
747
    "Предположим, мы провели эксперимент и посчитали для критерия его статистику $Q(\\xi)$. Обозначим полученное значение $q$, в текущей задаче это $q = 19$. Если бы количество успешных доставок было ещё больше, это бы сильнее свидетельствовало о том, что гипотеза $\\mathsf{H}_0$ не выполнена. То есть в случае значения $25$ мы были бы ещё сильнее уверены в том, что наш бизнес будет окупаться. Тогда значение $25$ называется *более экстремальным*, чем значение $19$. В нашей задаче более экстремально из двух значений то, которое больше.\n",
748
    "\n",
749
    "Определим понятие экстремальности формально:\n",
750
    "\n",
751
    "$$ S = \\{Q(\\xi) \\geqslant C\\}:\\ t\\ \\text{экстремальнее}\\ q \\Leftrightarrow t > q $$\n",
752
    "\n",
753
    "Зачастую критерии других видов можно привести к этому, тогда для них тоже определено понятие экстремальности."
754
   ]
755
  },
756
  {
757
   "cell_type": "markdown",
758
   "id": "3f73b537",
759
   "metadata": {},
760
   "source": [
761
    "### p-value\n",
762
    "\n",
763
    "**p-value** &mdash; это вероятность при справедливости $\\mathsf{H}_0$ получить столь же экстремальное значение статистики $q$ или ещё более экстремальное."
764
   ]
765
  },
766
  {
767
   "attachments": {
768
    "pvalue.png": {
769
     "image/png": "iVBORw0KGgoAAAANSUhEUgAAA0MAAAHFCAYAAAAwtiIDAAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMSwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy/bCgiHAAAACXBIWXMAAA9hAAAPYQGoP6dpAABcqUlEQVR4nO3dfXyP9f////tmJ2yNN2FDmXNCjSGWhJbSiSiS1BvpTDqZlJzUu6F+VqlFLL0rzSqk5ORdymqFio2QkxA1cza2mWGntrHn7w/fHR+vtrHXjJnjdr1cHpeL1/N4Hs/jebyOvdbuHa/X8+UiyQgAAAAAbMa1oicAAAAAABWBMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAF5gxxqFOnTqlo0eP6ueff9YjjzxS0dMrIiEhQcaYip5GsWrXrq2oqCgdPHhQJ0+elDFGQ4cOrehpVQotWrTQqFGjNG/ePP3999/Wz6O/v3+J+wwdOrTIz++ZNX/+/It4BgBQ/twqegIAYBdz5syRJFWpUkVNmzZV165d1a1bNwUHB2vw4MEVO7lKYvbs2br77ru1efNm/fjjjzp58qT+/vvvip5WpfDkk09q1KhRZdp306ZN2rRpU5H2tWvXnt+kAOASYCiKoqgLV4X+2X7LLbeYvLw8Y4wxd955Z4XPs7ASEhKKnW9Fl7u7u8nPzze7d+82Li4uFT6fylbDhw83YWFh5t577zUNGzY0O3bsMMYY4+/vX+I+Q4cONcYYExoaWuHzpyiKuhDFnSEAqCAxMTH69NNPNXz4cPXr10/Lli2r6Cld0vz8/OTm5qa9e/desm/ju5R9/PHHFT0FALjk8JkhAKhAv//+uyTp6quvPmu/9u3byxijuLi4Evs8/fTTMsbo7bffttqaNm2q0NBQrVmzRocOHVJubq7279+vqKgoNW/evNTz7N69u4wxioyMLHZ7ZGSkjDHq3r17kW01a9bUlClTtG3bNmVnZ+vYsWP68ccfdeedd5b6+AkJCdq3b58kqUePHtZnVhISEhz6denSRUuWLFFKSopOnDihhIQERUREqF69ekXGLPw8TGhoqJo3b6758+crKSlJp06dUt++fUs1rz59+mjNmjXKyspSamqqFi5cqObNmys0NJTPMwFAJcCdIQCoQD4+PpKk3Nzcs/b7/ffftWPHDnXu3FlNmjTR7t27i/R58MEHJUmfffaZ1fboo4/qxRdf1B9//KHffvtNubm5at26tYYMGaK+ffuqW7du2rp1azmekaPmzZsrJiZGDRs2VEJCgqKjo+Xj46MuXbrom2++0QsvvOAQ3kqycOFCNWrUSAMGDFBSUpKWL18uSUpNTbX6PPjgg5ozZ47c3Nz066+/av/+/QoMDNTIkSN17733qkePHtq5c2eRsVu2bKnffvtNR44c0YoVK1SzZk3l5+efc05PPPGE3n//fRUUFOiXX37RoUOH1KVLF61bt05ff/21E8/Spa9Dhw568803Vb16dSUlJemnn37Szz//XNHTAoByUeHv1aMoirqcq6TPDEkyq1evNsYY8+qrr55znJdeeskYY8zLL79cZFuTJk2MMcZs377dob1z586mUaNGRfoPGzbMGGPMjz/+WGRbcZ8Z6t69uzHGmMjIyGLnFhkZaYwxpnv37labq6ur2bx5szHGmBdeeMHhcz5NmzY18fHxJj8/37Rp06ZUz6O/v78xxpgVK1YU2XbVVVeZrKwsk5+fb/r06WO1u7i4mPDwcGOMMevWrXPYp/DzMMYY8+677xpXV9dSX9OGDRua7Oxsk5uba2699Var3c3NzXz66afWuEOHDi31mIXPuzPOfL6dLWc+M1ScFStWmLp161701xNFUVR5FneGAOAic3V1VZMmTTRhwgTdcMMNOnHiRIlvPzvT3Llz9dprr2nw4MF67bXXHLYV3hWaO3euQ3tJq33NmTNHjzzyiHr06KHq1asrPT29jGdTsj59+ui6667TwoUL9dZbbzlsi4+P1/PPP6/FixfrscceK/MqZ4UeffRReXl5ad68eQ53ZYwxGjdunAYOHKhOnTrphhtu0Jo1axz2TUlJ0dixY1VQUFDq4w0fPlzVqlVTVFSUvv/+e6v95MmTCgkJ0T333CNvb2+nzmHhwoWqXbu2U/skJSU51d9Zhw4dUmhoqJYuXardu3erWrVquv766/Xmm2+qR48e+uabb9SlSxennjsAuJQQhgDgIjHFfOg/PT1dQ4cOLfZtb/+0Z88erV69Wl27dlX79u2tzxtJJYchSfL29lafPn3Url071apVS+7u7pKkevXqydXVVU2bNnUYq7zceuutkqRFixYVu/2XX36RJF1//fXnfaxu3bpJKv788/Ly9OWXX2rUqFHq1q1bkTAUExOjnJycMh3v888/L7ItLS1N33//ve655x6nxhwzZoxT/S+G77//3iHsZWRk6JtvvtGKFSu0YcMGderUSQMHDiz2eQCAyoAwBAAXSeH3DBUUFCg9PV1bt27VokWLdOzYMatPcXeIlixZoqVLl0o6/cd+165d9eCDD1oBpkOHDmrZsqVWr16tPXv2OOzbs2dPff7556pbt26J8yr83FJ5a9SokSRp3rx5mjdvXon9nL0bUpz69etLUpHzL1TY3qBBgyLbChdmKMvx9u7de9bjXa6ysrL07rvvKiIiQrfddhthCEClRRgCgIvk4YcfPmefYcOGFWnbs2ePFYYWLFigadOmadCgQRozZoyMMSXeFfL29tYXX3yhWrVqadKkSfr888+1d+9e6y7I3LlzNXjwYLm4uJznmZ1+619Jbd99952Sk5NL3PfMRRAulOLuyhU6ceLEBT9+aUydOtXpYPj6668XuyjExfDXX39JUrEr9QFAZUEYAoBLyLmCSVpamqKjo9WnTx/16NFDq1at0qBBg5SXl6cFCxY49O3WrZtq166tL7/8UhMnTiwyVpMmTUo9r7y8PEnSFVdcUez24pYGP3DggCTpo48+KvGtcuXl4MGDatWqlfz9/bV9+/Yi2wvvUiUmJpbL8Q4dOmQdb8eOHUW2+/v7Oz3mgAEDrHmW1pw5cyosDNWsWVPS6btEAFBZ8T1DAFDJFN4BGjx4sG6++WbVq1dP0dHRSktLc+hX+MdqYSg5U9OmTRUYGFjqYx46dEiS1KJFiyLbatasWexYP/zwgyQ5/dmZsij8/NEDDzxQZJu7u7vuu+8+h37ldbyBAwcW2VazZk3r81LOaNy4sVxcXJyqVatWnfe5lFX//v0lSRs3bqywOQBAeajwJe0oiqIu5ypUXuNVrVrVHD9+3KSlpZl58+YZY4y5//77i/Tr0KGDMcaYPXv2mNq1a1vtNWrUMCtXrixxeebiltaWZPbs2WOMMebuu++22ry8vMyXX35Z7FhVqlQxf/zxhzHm9HLgHh4eRca84YYbzA033FCq8z7b0tpXX321ycrKMnl5eeaOO+6w2l1cXMzUqVONMcb89ttvDvsULhsdGhrq9DVo1KiRycnJMbm5uSY4ONhqd3NzM3PmzLGeD2eW1r7YVZqltceNG2euvPJKhzY3NzfzyiuvGGOMycrKMvXr16/wc6EoijqPqvAJUBRFXdZV3mFIksMf3MePHzdVq1Yttl90dLQxxpi0tDSzaNEis2jRIpOWlmZ27dplFi9e7FQYevjhh40xxuTn55sff/zRLF261Bw6dMjs3LmzxLGaNWtm4uPjjTHGJCUlme+//9589tlnZvny5SYpKckYY0xISEipzvlsYUiSeeihh8zJkyfNqVOnzM8//2zmzp1r/cF/6NAh07JlS4f+5xOGJJmRI0caY4w5efKk+emnn8y8efPM7t27zdGjR63vGrqUwlD79u1NbGysVdnZ2cYYYzZu3Gi1PfLII0V+dnNycswvv/xi5s2bZ7755htz4MABY4wx2dnZ5p577qnw86IoijrPqvAJUBRFXdZ1IcJQr169rHHnzJlTYr+qVauaV1991ezcudPk5OSYvXv3mvfee8/UqlWr2C9KlUoOQ9LpALFlyxZz4sQJc+jQIfPBBx+cdSxJpnr16mbChAlm/fr1Jj093WRnZ5vdu3eb7777zjz55JNF7jyUVOcKQ5JMUFCQWbp0qTl8+LDJzc01e/bsMREREcXevTjfMCTJ9O3b18TGxpqsrCxz5MgRs3jxYtOyZUsTGhp6yYWhwi/OPZt/PhcTJ0400dHRZs+ePSYrK8tkZ2ebXbt2mVmzZpkWLVpU+DlRFEWdb7n8v38AAIByEhoaqokTJ2rYsGGKioqq6OkAAErAAgoAAAAAbIkwBAAAAMCWCEMAAAAAbInPDAEAAACwJe4MAQAAALAlwhAAAAAAW3Kr6AmUl/r16ysjI6OipwEAAACggvn4+OjgwYPn7HdZhKH69esrMTGxoqcBAAAA4BLRoEGDcwaiyyIMFd4RatCgAXeHAAAAABvz8fFRYmJiqXLBZRGGCmVkZBCGAAAAAJQKCygAAAAAsCXCEAAAAABbIgwBAAAAsKXL6jNDAACgbFxdXeXu7l7R0wCAUsnPz1dBQcF5j0MYAgDA5vz8/PSvf/2roqcBAE45duyYkpKSzmsMwhAAADZWGIRSUlKUnZ0tY0xFTwkAzsrFxUVeXl6qW7euJJ1XICIMAQBgU66urlYQSktLq+jpAECpnThxQpJUt25dpaSklPktcyygAACATRV+Rig7O7uCZwIAziv83XU+n3ckDAEAYHO8NQ5AZVQev7sIQwAAAABsiTAEAAAAwJYIQwAAAABsidXkAABAER4eHvL09Lxox8vNzVVeXt5FO15Fe//993XFFVfooYcequipqFatWtqxY4euv/567d27t6Knc17mz5+v3377TeHh4RU9FVQiprKXj4+PMcYYHx+fCp8LRVEURVWW8vT0NK1atTKenp5FtoWGhpqLKTQ01On5R0ZGWvvn5uaav/76y/znP/8xVapUcdg+a9asIvvOnDnTGGNMZGRkseOdqWnTpk7Na+XKlQ77HzlyxCxevNjUrl3b6lOzZk3j5eVV4T8Dkszbb79tPvjgA4e2kSNHmoSEBJOTk2Pi4uJMp06dzjpGcT8vO3bsKPUcRowYYTZv3myOHz9ujh8/btasWWN69+5dpN+55tWmTRtz5MgRU7169Qp/XqkLXyX9DnMmG/A2OQAAUGl999138vPzU/PmzfX2229r4sSJGjNmjLV93759GjRokKpWrWq1eXp6avDgwcXeBSkc78xKSEhwak7t27fX888/Lz8/P9WvX18PPPCAgoODNX78eKvP0aNHL4klzatVq6ZHHnlEs2fPttoGDhyo8PBwTZo0SYGBgdq8ebOio6NVp06ds471xx9/ODxvN954Y6nnceDAAY0bN04dOnRQx44d9dNPP2np0qVq3bq1U/Patm2b4uPjL4k7bqgceJscAOCS4OHh4fDH4rmEhYXZ6m1VKF5ubq6Sk5MlnX7r2T333KO7775br7/+uiRp48aNatq0qe69917NmzdPknTvvfdq3759xYacM8cri+bNm6t69epauXKlNc6hQ4f0999/y8vLS5Lk7++vPXv2qFGjRtq7d6+aNGmi+Ph43XXXXXruuecUFBSk/fv3a8iQIVq3bp01dps2bfTmm2/qxhtvVHZ2tubOnavx48crPz/fGrN///4KCQlRp06d9Mcff6h///7y9/fX1KlTdd111yk2Nlb9+/fX8ePHJUl33HGHcnNztXbtWus4o0eP1ocffqg5c+ZIkkaMGKE777xTw4cP1xtvvFHiuZ88ebLMz90333zj8Pjll1/Wk08+qS5dumj79u1Ozevrr7/WoEGD9N5775VpLrAXwhAA4JLg6empiRMnlrp/eHg4YQhF5OTk6Morr3Ro+/jjj/Xwww9bYWj48OGKjIxUjx49yv34HTp0UG5urrZu3SrpdMgfMmSImjVrpuHDh0uSAgICdPToUevOVEBAgAoKCjR69GhNnjxZiYmJeu+99/T666/r5ptvliS1a9dOq1at0rvvvqtnn31WV111lebNm6djx47ptddeU0BAgCTpySef1IQJE5SVlaWlS5fqs88+U0ZGhp5++mlVqVJFy5Yt08MPP6xp06ZJkrp166YNGzZY83d3d1eHDh0UFhZmtRljFBMTo6CgoLOee/PmzZWYmKgTJ04oNjZW48eP1/79+51+Dl1dXXXffffJ29tbsbGxTs9r3bp1eumll+Th4cHvCJwTYQgAAFwWgoODddttt2nGjBkO7Z999pnCwsLUsGFDSVLXrl01aNCgYsPQXXfdpYyMDOvxd999p4EDB5Z6DoGBgXJ3d1daWpokycvLSykpKbr11lu1adMmSaeDzZYtW6x9AgICdOzYMd1///1KTU2VJP3vf//TE088YfX58MMP9emnn+o///mPJCk+Pl6RkZG666679Nprr6ldu3Y6cuSI7r//fuvYq1at0o033qg2bdooJydHkvTbb7/Jz8/PGtff318HDx60HteuXVtubm5F7vAkJyerVatWJZ732rVrNWzYMO3cuVP16tVTaGiofvnlF7Vt21aZmZmleu7atm2r2NhYVa1aVZmZmbrnnnu0Y8cOp+d18OBBeXp6ys/PT/v27SvVsWFfhCEAAFBpFYYXd3d3ubq6at68eUXuMKampmrZsmUaNmyYXFxctGzZMh05cqTY8VasWKEnn3zSepyVleXUfAIDAzV//nyFhoZKkurUqaPXX39d77//vtq3by9jjAICAqxgJJ0OQ0uXLrWCkCQ1btxYf//9tySpZcuW6tixY5HPweTl5Vkr/gUEBGjx4sVWEJKkhg0basGCBVYQKmxbunSp9bhatWo6ceKEU+dYnOXLl1v/3rp1q9auXau9e/dq4MCB+vjjj0s1xs6dO9WuXTvVqFFDAwYMUFRUlLp3724FotIqPN/CtyUCZ8MCCgAAoNJasWKF2rVrp+bNm6tatWoaNmxYsQsTfPzxxxo2bJiGDh161j/Os7KyFB8fb1VSUpJT8wkMDNSvv/5q7R8XF6fw8HAFBAToqquuknT6ztDmzZutfQICAqy3gxVq166dFZjatGmjvLw87dq1y6FP69atrbfjtWvXzuFzP4XjxsXFWY89PT3VsmVLh2OnpqaqZs2aDo9PnjwpX19fh7F8fX2dei6OHz+uXbt2qVmzZqXeJz8/X/Hx8dq4caMmTJigzZs3KyQkxOl51apVS5J0+PDhUh8b9kUYAgAAlVZheNm/f79OnTpVYr/ly5fLw8ND7u7uio6OviBzady4sWrWrKnff//dob1p06bKz8/XsWPH5OPjo0aNGllBp3r16mrcuHGRfc4MQxkZGapSpYrc3d2t7Y0aNdI999yjuXPnWmOeOUajRo30r3/9y6Ht2muvlYuLixWgJOn33393WLEtPz9fGzZsUHBwsNXm4uKi4ODgIoHtbLy9vdW0aVMdOnSo1Pv8k6urq3Xny5l5tW3bVvv37y/x7h9wpjKFoZEjRyohIUE5OTmKi4tTp06dSuzbunVrLVy4UAkJCTLGWAm/JGPHjpUxRu+8805ZpgYAAFBEQUGBrrnmGrVu3VoFBQUX5BgdOnRQQUGBUlJS5OvrqyZNmmjYsGF65ZVXNGvWLGVkZCggIECnTp3Stm3bJEnXXXed8vPzHQJKw4YNVatWLSsMrV27VseOHdPrr7+uxo0bq2fPnlq2bJk+//xzRUdHW2P+8ccf1hiFnyE68zMz7dq1U3x8vMNb/6Kjo9WmTRv961//strCw8P12GOPaciQIWrVqpVmzZolb29vRUZGWn2eeuopxcTEWI+nTp2qm266Sf7+/goKCtLixYt16tQpzZ8/v1TP3ZQpU9StWzf5+/urbdu2mjJlinr06KG5c+c6NS/p9KIQ33//famOCzj9maHCNd5HjBihtWvXatSoUYqOjlbLli2LvR3p5eWl3bt368svvzxnwOnYsaOeeOIJh9u3AAAA5eHMhRHKYujQoZozZ45cXFyK3R4YGChXV1ft3r1bkpSWlqa//vpLo0aN0ieffCLp9FvX/vzzT2uVs4CAAO3cuVO5ubnWOO3bt3dYbS49PV39+vXTtGnTNGLECB08eFAffvihpk6dWuIYAQEBRe42BQQEFPkb648//tDGjRs1cOBAffDBB5KkL774QnXq1NHkyZPl5+enTZs2qXfv3kpJSbH2q127tpo2bWo9vuqqqzR//nxdeeWVOnz4sH799Vd16dLF4XNQZ3v+6tatq08++UT16tXT8ePHtWXLFt12220Ogas08/L09FS/fv3Uu3fvYq8RUBynvuk1Li7OzJgxw3rs4uJiDhw4YMaOHXvOfRMSEkxISEix27y9vc3OnTtNcHCwWbFihXnnnXdKPSdnvmWWoiiKujSr8Hd5afE7//yrpG9vl2RCQ0Oduh7nKzQ0tMKfj3PVxIkTzYoVKyp8HuVdd9xxh9m2bZtxcXGp9M/fiBEjTHR0dIU/p9TFqZJ+hzmTDZy6M3Q+a8+fS0REhJYtW6Yff/xRL7/88nmNBQAAzk9YWJjCw8Mv2vHOvKtxqbr99tv19NNPV/Q0yt23336r5s2bq0GDBjpw4MAFO87FeP7y8/P1zDPPXNBj4PLiVBgq69rz53L//fcrMDDwrJ89OpOHh4f1gTpJ8vHxKfOxAQBAUXl5eXxh5T907ty5oqdwwUyfPv2CH+NiPH+zZ8++4MfA5aXCV5O76qqrNH36dD344IOl/r9C48ePV3p6ulWJiYkXeJYAAAAALjdOhaHyWnv+TB06dJCvr682btyo/Px85efnq0ePHnr22WeVn58vV9eiUwwLC1P16tWtatCgQZmODQAAAMC+nApD5bX2/Jl+/PFHtW3bVu3atbPqt99+09y5c9WuXbtil7/My8tTRkaGQwEAAACAM5xeWjs8PFxRUVFav3691q1bp1GjRjms8R4VFaXExERNmDBB0ulFFwq/zMvDw0MNGjRQQECAMjMzFR8fr8zMTGut/UJZWVk6cuRIkXYAAAAAKC9Oh6FzrfHesGFDh7s59evXt740TJLGjBmjMWPGaOXKlerZs+f5nwEAAAAAlIGLTq+xXan5+PgoPT1d1atX5y1zAFBJFf4uLy1+558/T09PNW7cWAkJCZViaWsAOFNJv8OcyQYVvpocAAAAAFQEwhAAAAAAWyIMAQCAIjyquOoKT7eLVh5VLt6fJN27d5cxRjVq1Dhrv4SEBIWEhJTbcVesWKF33nnnrH0ee+wx7du3T6dOnVJISIhCQ0P1+++/l/oY/v7+MsYoICCgxD6lOX9fX199//33yszM1NGjR0t9fKCycXoBBQAAcPkb2bOpRt3S4qIdb1rMLk2L+cupfXx9ffXSSy/pzjvvVIMGDZSSkqJNmzZp2rRp+umnn0rcb82aNfLz89Px48clSUOHDtW0adNUs2ZNh36dOnVSVlaW8ydTRj4+Ppo5c6ZGjx6tr776SsePH5erq6tmzJhx0eZQ6LnnnlO9evXUrl0763kqT48++qiefvppNW3aVCdPnlRCQoK++OILvf766+V+LOBsCEMAAKDS8ff31+rVq3Xs2DGNGTNGW7dulbu7u2677TZFRETommuuKXY/Nzc35efnKzk5+ZzHSE1NLe9pn1XDhg3l4eGhZcuWOXyZ/cUMZIWaNm2qDRs26O+//y7zGO7u7srPzy/S/vDDD2vatGl69tlntWrVKnl6euq6665T27Ztz2fKQJkQhgAApeLh4aHx48eXun9YWJjy8vIu4Iycc+b8vbKy9OJbbzlsf/OFF5Tt7W09vtTmD0fvvfeejDG6/vrrlZ2dbbVv375dH3/8sfXYGKMnn3xSt99+u4KDgzV16lStXLlSK1eu1L/+9S+1a9dOc+bMsfpK0sSJEzVp0iQlJCRo2rRpmj59uiSpRo0aeuONN9SvXz/VqFFDf//9t8aNG6dly5apVq1amjlzpm666SbVrFlT8fHxmjJlij7//PNSnc/QoUOteSQkJEiSGjVqpGHDhqlfv35q37691feRRx7R888/r8aNG2vPnj169913NWvWrBLHvv322zVt2jRdffXViouLU1RU1FnnkpCQoEaNGjnM6+GHH9bVV1+tGTNmKDg4WAUFBVq+fLmeeeYZ6+tVQkND1a9fP82cOVMvvfSS/P39VaVKlSLj33333friiy8crtP27dtL9TwB5Y0wBAAoFU9PT02cOLHU/cPDwy+pMOEw/8OHpX+EoRdffFGqU8d6fKnNH/+nZs2a6t27t1566SWHIFTon2/rmjhxosaNG6dRo0bp5MmTatKkibVtzZo1CgkJ0eTJk9WyZUtJUmZmZpExXVxc9N1338nHx0cPPfSQ4uPj1bp1a506dUqSVLVqVW3YsEFvvPGG0tPTdeedd+rTTz9VfHy8fvvtt3Oe04IFC7R//379+OOP6tSpk/bv36/Dhw8X6Td48GBNnjxZTz/9tH7//Xe1b99eH374obKysvTJJ58U6X/VVVdp0aJFioiI0AcffKCOHTvq7bffPutcOnXqpE8++UTp6ekKCQlRTk6OXFxctHTpUmVmZqp79+5yc3NTRESEFixY4PC9kc2aNVP//v117733Ws/NPyUlJal79+5q2LCh9u3bd87nBriQCEMAAKBSadasmVxdXfXnn3+Wqv+8efOsuy6SHMJQfn6+jh8/LmPMWd86d8stt+j666/XNddco7/+Ov3ZpsI7OJJ08OBBh5Axc+ZM3XbbbRo4cGCpwtCJEyd05MgRSdLhw4dLnMukSZP0/PPPa/HixZKkPXv2qHXr1nriiSeKDUNPPvmk4uPj9cILL0iSdu3apWuvvVbjxo0rcS6pqanKzc1VTk6ONY9bbrlF1157rRo3bqwDBw5IkoYMGaLt27erY8eOWr9+vaTTd2CHDBly1rcYTpo0SYsWLdLevXu1c+dOxcbG6ttvv9XChQutu3PAxcJqcgAAoFJxcXFxqn/hH+rno127djpw4IAVhP7J1dVVL7/8srZs2aIjR44oIyNDt912mxo2bHjexy7k5eWlZs2aafbs2crIyLDq5ZdfVtOmTYvd55prrtHatWsd2mJjY50+9jXXXKP9+/dbQUiSduzYoaNHjzp8Pmvv3r3n/KxVUlKSbrjhBrVt21bTp0+Xm5uboqKitHz5cqevLXC+uDMEAAAqlb/++ksFBQVq1apVqfqXxwIEOTk5Z90+ZswYhYSEaNSoUdq6dauysrI0bdo0eXh4nPexC11xxRWSTi+//c+AU9Jb0i42Z57rbdu2adu2bZo1a5bef/99/frrr+revbtWrlx54SYI/AN3hgAAQKVy9OhRRUdH66mnnpKXl1eR7ef6/qB/ysvLK/aD/mfasmWLrrrqKjVv3rzY7V27dtXSpUs1d+5cbdmyRbt371aLFuW7NHlKSooSExPVpEkTxcfHO9SePXuK3WfHjh26/vrrHdq6dOni9LF37Nihq6++WldddZXVds0116hmzZrlsvhB4RjeZyxiAlwMhCEAAFDpPPXUU6pSpYrWrVune++9V82aNVOrVq30zDPPOP02sD179sjHx0c333yzrrzySlWrVq1In59//lk///yzvvrqK91yyy1q1KiRevfurdtuu03S6btVvXr1UlBQkFq1aqX//ve/8vX1LZdzPVNoaKjGjx+vZ555Rs2bN1fbtm01bNgwPffcc8X2f//999W8eXO9+eabatGihR544AENGzbM6ePGxMRo69atmjt3rtq3b28tsrBy5Upt2LDBqbHee+89vfzyy7rhhhvUsGFDde7cWZ988olSUlLK9BY+4HwQhgAAQKWTkJCgwMBArVixQm+//bb++OMP/fDDDwoODtaTTz7p1FixsbGaNWuWFixYoNTU1NMrCxajf//++u233zR//nxt375db775pnVH6bXXXtPGjRsVHR2tlStXKikpSUuWLDnf0yxi9uzZevTRR/Xwww9r69atWrVqlYYNG+awmMOZ9u/fr/79+6tfv37avHmzRowYoQkTJpTp2H379tXRo0f1888/KyYmRrt379b999/v9DgxMTHq0qWLvvzyS+3atUtfffWVTpw4oeDgYKWlpZVpbkBZuUiq9Mt2+Pj4KD09XdWrV1dGRkZFTwcALkuFv2tLy9nfyRd1/MOHpbp1HTukpDgsrW2H/6Z4enqqcePGSkhIUG5ursO2Ubc016hbyvdtXmczLWaXpsUUvzgBABSnpN9hzmQDFlAAAABFvLciXh/9Uvzdhgsh72TBRTsWABQiDAEAgCLyThUo7xQBBcDljc8MAQAAALAlwhAAAAAAWyIMAQAAALAlwhAAAAAAWyIMAQAAALAlwhAAAAAAWyIMAQAAALAlwhAAAACctmLFCr3zzjtO72eMUd++fS/AjC4f/v7+MsYoICCgoqdy2SMMAQCASicyMlLGGM2aNavItpkzZ8oYo8jIyAqY2fkbOnSojh49WtHTOG+hoaH6/fffK3oacJKnp6dmzpyp1NRUZWRkaOHChapbt26p9581a5aMMQoJCbHa/P399dFHH2n37t3Kzs7W33//rYkTJ8rd3d1h31tvvVWxsbFKT09XSkqKFi5cKH9//3I7t+IQhgAAQKW0b98+DRo0SFWrVrXaPD09NXjwYO3du/e8x69Spcp5j3Eh/fMPSaA8vPPOO+rTp4/uu+8+de/eXfXr19eiRYtKtW+/fv3UpUsXJSYmOrS3atVKrq6ueuKJJ9SmTRs999xzGjFihKZMmWL1adSokZYuXaqffvpJ7dq102233abatWuX+tjnw1T28vHxMcYY4+PjU+FzoSiKulyr8HdtaTn7O/mijp+SYozkWCkp5zV+ZSxPT0/TqlUr4+npWWRb7Ytczs49MjLSLF682GzZssUMHjzYan/ggQfMpk2bzOLFi01kZKTV7uHhYaZPn26Sk5NNTk6O+eWXX0zHjh2t7d27dzfGGNO7d2+zfv16k5uba7p3725cXFzMuHHjzO7du012drbZtGmT6d+//1nn5uHhYaZOnWoOHDhgMjMzTVxcnOnevbv1nP/xxx/mv//9r9W/SZMmJj093Tz88MPWPM4UGhpqJJmEhATz8ssvm6ioKHP8+HHr/Lp27Wp+/vlnk52dbfbt22emT59uvLy8rPETEhLMSy+9ZKKiokxGRobZs2eP6dOnj6ldu7ZZsmSJycjIMJs3bzYdOnSw9qlVq5aZN2+eOXDggMnKyjJbtmwxgwYNcjjPFStWmHfeeafY52Do0KFFzmPo0KFGkjHGmEceecQsWrTIZGVlmV27dpk+ffpY+7q6upqPPvrIes7//PNP8+yzzxZ7/Z9//nlz8OBBk5qaambOnGnc3NzOem3Gjh1rkpKSTHp6uvnoo49MWFiY+f3335362Su8DvPmzTOZmZnmwIEDZuTIkdb2uXPnms8//9xhHzc3N3P48GHz73//20gyt912m/nll1/M0aNHTWpqqvn6669NkyZNrP7+/v7GGGMCAgKs5/Po0aMOY/bt29cYYxza7r77brNhwwaTk5Nj4uPjzSuvvGKqVKlS6nOrXr26yc3NdfgZb9mypTHGmM6dO5913/r165v9+/eb1q1bm4SEBBMSEnLW/i+88IKJj4+3Hvfv39/k5eUZFxcXq+2uu+4yp06dKvG6lvQ7zMlsUHG/hMurCEMURVEXvghDl1+dLQwVeX4ucDk798I/hkeNGmV++OEHq/2HH34wISEhRcLQtGnTzIEDB0zv3r3NNddcYyIjI82RI0dMzZo1jfR/YWjTpk3mlltuMU2aNDE1a9Y0EyZMMNu3bze33nqrady4sRk6dKjJyckxN910U4lz++CDD8yvv/5qbrzxRtOkSRPz/PPPm5ycHNOsWTMjyQQEBJgTJ06Yu+++27i6upo1a9aYr776ykgy7u7u5tlnnzXHjh0zvr6+xtfX13h7exvp9B/hx44dM6NHjzZNmjSxKiMjw4SEhJhmzZqZoKAgs2HDBvPxxx9b80lISDCpqanm8ccfN82aNTMRERHm2LFj5ttvvzUDBgwwzZs3N4sWLTLbtm2z9qlfv755/vnnTUBAgGncuLF5+umnTX5+vunUqZPV52xhqGrVqmbq1Klm69at1nlUrVr19M+WMWbfvn1m0KBBpmnTpmbatGkmPT3duhZubm5m4sSJpkOHDqZRo0Zm8ODBJjMz09x3330O1//YsWPmvffeMy1btjR33nmnyczMNI8++miJ1+W+++4zOTk5Zvjw4aZFixbm1VdfNcePHy9TGDp+/LgZO3asad68ufXc3HLLLUaSueOOO0xWVpZ13SSZO++802RlZZkrrrjCSDL33nuvueeee0zTpk1NQECAWbp0qdm8ebMVBMoShm688UZz7NgxM2TIENO4cWNzyy23mN27d5tXXnnF4XlbsWJFiefWs2dPY4wxNWrUcGjfs2ePGTVqVIn7ubi4mB9//NEKraUJQ6+++qr57bffrMeNGjUyJ06cMMOHDzeurq6mevXqZsGCBSY6OrrEMQhDZTthiqIoqgxFGLr86nIIQ7Vr1zY5OTmmYcOGpmHDhiY7O9tceeWVDmHIy8vL5ObmmgceeMDa383NzRw4cMC88MILRvq/MHT33XdbfTw8PExmZqbp0qWLw7E//PBDM3fu3GLndfXVV5v8/HxTr149h/YffvjB/H//3/9nPX7hhRdMSkqKeffdd01iYqKpVauWta24P3yl039gLlq0qMhc3n//fYe2rl27mpMnT1rXNSEhwXzyySfWdl9fX2OMMZMmTbLaOnfubIwxxtfXt8Tn/OuvvzZTp061Hp8tDEkyoaGhxQYNY4yZPHmy9djLy8sYY8xtt91W4lgzZswwX375pcP1T0hIMK6urlbbggULzPz580scY/Xq1WbmzJkObbGxsWUKQ99++61D2/z5882yZcuMJFOlShWTkpJiHnroIWv73Llzzzq3K6+80hhjTJs2bYxUtjD0ww8/mHHjxjn0efDBB01iYqL1eMqUKSYqKqrEeTzwwAPmxIkTRdrXrl1rXn/99RL3GzdunENoOVcYatq0qTl27FiR8HrTTTeZpKQkk5+fb4wxZvXq1UWC2ZlVHmHITQAAAJVUamqqli1bpmHDhsnFxUXLli3TkSNHHPo0bdpUHh4eWr16tdV28uRJrVu3Ttdcc41D3/Xr11v/btasmby9vfXDDz849PHw8ChxYYBrr71Wbm5u2rVrl0O7p6enw7zefvtt9evXT88884x69+6ttLS0Up3vmfOTpICAAF133XV68MEHrTYXFxdVqVJFjRs31p9//ilJ2rJli7U9OTlZkrR169YibXXr1lVycrJcXV01YcIEDRw4UA0aNJCHh4c8PT2VnZ1dqnmey5nzyc7O1vHjxx0+pD9y5EgNHz5cDRs2VLVq1eTh4aFNmzY5jLFt2zYVFBRYjw8dOqRrr722xGNec801ev/99x3aYmNj1bNnT6fnHxsbW+TxqFGjJEmnTp3SF198oQcffFCfffaZvLy81LdvXw0aNMjq36xZM02ePFmdO3dW7dq15ep6+mP8DRs21LZt25yej3T6Z6Fr16566aWXrLYqVaqoWrVqqlatmnJycjRhwoQyjX02gYGBCgkJUWBgYKn6169fX8uXL9eXX36pjz76yGr39fXVhx9+qKioKM2fP18+Pj6aPHmyFi5cqF69epX7vAsRhgAAQKX28ccfa+bMmZKkp5566rzGysrKsv59xRVXSJLuvPPOIh8Iz83NLXb/K664QidPnlSHDh106tQph22ZmZnWv+vWrasWLVro5MmTat68uaKjo52eX+Hx/vvf/+rdd98t0nffvn3Wv/Pz84tsP7Pt9A0GWX+UjxkzRiEhIRo1apS2bt2qrKwsTZs2TR4eHqWa57n8cz7GGOvY999/v9566y09//zzio2NVUZGhsaMGaPOnTuXeoyKNnfuXK1atUp16tRRr169lJOTo+XLl1vbv/76a+3du1ePPfaYDh48KFdXV23btq3E57egoEAuLi4Obf9cQOOKK65QaGhosQsOnDhxolTzTkpKkqenp2rUqKHjx49b7b6+vkpKSip2n27duqlu3boOP29ubm56++23NWrUKDVu3Nhqr1evnlasWKE1a9bo8ccfdxjnqaee0vHjxzV27Fir7aGHHtKBAwfUuXNnrV27tlTn4CzCEAAAKKJORU/ACcuXL5eHh4eMMcWGivj4eOXm5qpr167WH2xubm7q1KmTpk2bVuK427dv14kTJ9SwYUP9/PPPpZrL77//Ljc3N9WtW1e//vprif0+/vhjbd26VbNnz9aHH36omJgY6y5OXl5eqVey27hxo1q3bq34+PhS9S+trl27aunSpZo7d66k03ebWrRooe3bt5d6DGfO45/HXrNmjcOy6U2bNnV6nH/asWOHOnfurE8//dRq69KlS5nG+ud+Xbp00Y4dO6zHsbGx2r9/v+6//37dfvvt+vLLL3Xy5ElJUq1atdSqVSs99thj1s9I165dz3q8w4cPy8fHR15eXtbduXbt2jn02bhxo1q2bHlePwsbNmxQXl6egoODrVDVokUL+fv7F7kbVujTTz9VTEyMQ1t0dLQ+/fRTh+Xt69evrxUrVmjDhg16+OGHrQBeyMvLy+FOnyTrfyhcyJBLGAIAAEWkVvQEnFBQUGC93e2ff0xJp9+GNWvWLE2dOlVpaWnat2+fXnzxRXl5eWn27NkljpuZmam33npL77zzjlxdXfXrr7+qRo0a6tq1q9LT0/XJJ58U2eevv/7SZ599pk8++UTPP/+8fv/9d9WpU0fBwcHasmWLvv32W40cOVJBQUG67rrrdODAAd15552aO3euunTpovz8fO3Zs0c+Pj66+eabtXnzZmVnZysnJ6fYOb7xxhuKi4vTjBkz9NFHHykrK0utW7dWr1699Mwzz5TxGT19HgMGDFBQUJCOHj2q0aNHy9fX16kwtGfPHjVu3FgBAQE6cOCAMjIylJeXV6pjDxkyRLfeeqsSEhL073//W506dVJCQkKZz0eSpk+frjlz5mj9+vVavXq1HnzwQbVp00a7d+92eqyuXbtqzJgxWrJkiXr16qX77rtPd955p0OfefPmacSIEWrRooXDW/GOHj2q1NRUPf744zp06JAaNmyo119//azHW7t2rbKzszVlyhS9++676ty5s4YNG+bQZ/Lkyfrmm2+0b98+LVy4UAUFBQoICFDbtm31n//8R5I0ZcoUNWjQQEOHDi32OOnp6Zo9e7bCw8OVlpam9PR0zZgxQ2vWrHG4M7Njxw6NHz9eS5YsUVpaWpG3eebn5yspKcl6u2j9+vW1cuVK7d27Vy+88ILq1Pm//91S+BbNZcuW6bnnntN//vMf621yU6ZM0Z49ey7491U59aGxS7FYQIGiKOrCFwsoXH51tgUULvUqXEChpO3/XE3O09PTTJ8+3aSkpJx1ae3iPqz97LPPmh07dpjc3FyTnJxsvvvuO9OtW7cSj124Gtru3btNbm6uSUxMNF999ZVp27atadmypcnKynJYprpGjRpm7969Dh9Qf++998zhw4eNMY5Laxf3ofSOHTua6Ohok56ebjIyMsymTZvM+PHjre3F7WeMMX379rUe//MD+zVr1jSLFy826enpJikpyUyePNnMmTPH4Tk/1wIKHh4e5ssvvzRpaWnGGMeltc88tiRz9OhRa7uHh4f5+OOPzdGjR01aWpqJiIgwU6ZMcVjooLjr/84775x1pTRJZvz48SYlJcWkp6ebyMhI8/rrrzuMW/hz4O/vX+IYCQkJ5j//+Y9ZsGCByczMNAcPHjTPPPNMkX6tWrUyxhiTkJBQZFtwcLDZtm2bycnJMZs2bTI33XSTw/Pyz+shnV4wYdeuXSYrK8v873//M48++qgxxnFp7VtvvdX8+uuvJisryxw7dszExcU5LFJwrtXkCl8rM2fONEeOHDGZmZnmq6++KrKwxpnXs6Tn6MyfueKWWi905n7333+/2bBhg8nIyDDJyclmyZIlpmXLlmedK6vJOX/CFEVRVBmKMHT5VWUOQxRVHvXPFe+GDRtmdu3addbvKyrNstHUxanyCEOXxqfMAAAAgAp2xx13aMKECdbne3D54zNDAAAAgKSBAwdW9BRwkRGGAAAAYEuTJk3SpEmTnNrnzKWiUfmV6W1yI0eOVEJCgnJychQXF6dOnTqV2Ld169ZauHChEhISZIxRSEhIkT7jxo3TunXrlJ6eruTkZC1evFgtWrQoy9QAAAAAoFScDkMDBw5UeHi4Jk2apMDAQG3evFnR0dEOS+SdycvLS7t379a4ceN06NChYvt0795dERER6tKli3r16iV3d3d9//338vLycnZ6AADASf/8MkcAqAzK63eXU6s2xMXFmRkzZliPXVxczIEDB8zYsWPPuW9pV9+oXbu2McacddnKM4vV5CiKoi58sZrc5Veurq6mVatWplatWhU+F4qiKGerVq1aplWrVsbV1dWh3Zls4NRnhtzd3dWhQweFhYVZbcYYxcTEKCgoyJmhzqpGjRqSVOQLnAp5eHjI09PTeuzj41NuxwYAwC4KCgp07Ngx1a1bV9LpLyc1//hWeAC41Li4uMjLy0t169bVsWPHiv2y5dJyKgzVrl1bbm5u1jfFFkpOTlarVq3KPIkzubi4aNq0afr111+1bdu2YvuMHz9eEydOLJfjAQBgZ0lJSZJkBSIAqCyOHTtm/Q4rq0tuNbmIiAi1bdtWN954Y4l9wsLCFB4ebj328fFRYmLixZgeAACXnaSkJKWkpMjd3b2ipwIApZKfn39ed4QKORWGUlNTdfLkSfn6+jq0+/r6nncqk6QZM2borrvu0k033XTWcJOXl6e8vLzzPh4AADitoKBAubm5FT0NALionFpNLj8/Xxs2bFBwcLDV5uLiouDgYMXGxp7XRGbMmKF77rlHN998s/bs2XNeYwEAAADAuTj9Nrnw8HBFRUVp/fr1WrdunUaNGiVvb29FRkZKkqKiopSYmKgJEyZIOr3oQuvWrSWdXvigQYMGCggIUGZmpuLj4yWdfmvc4MGD1bdvX2VkZFh3no4fP64TJ06Uy4kCAAAAwD85vYzdU089Zfbs2WNOnDhh4uLizPXXX29tW7FihYmMjLQe+/v7F7sk6ooVK6w+JRk6dGip5sPS2hRFURe+WFqboiiKqgx1wZbWLhQREaGIiIhit/Xs2dPh8d69e8/5hUh82RsAAACAi82pzwwBAAAAwOWCMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAltwqegIAgPPn4eGh8ePHl7p/WFiY8vLyLuCM7OfMa+CVlaUX33rLYfubL7ygbG9v6zHXAAAqnoskU9GTOF8+Pj5KT09X9erVlZGRUdHTAYCLrvD3YGmV5fflhT7GRR3/8GGpbl3HDikpUp06l+z4AIDScSYb8DY5AAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZUpjA0cuRIJSQkKCcnR3FxcerUqVOJfVu3bq2FCxcqISFBxhiFhISc95gAAAAAcL6cDkMDBw5UeHi4Jk2apMDAQG3evFnR0dGqU6dOsf29vLy0e/dujRs3TocOHSqXMQEAAACgPBhnKi4uzsyYMcN67OLiYg4cOGDGjh17zn0TEhJMSEhIuY4pyfj4+BhjjPHx8XHqXCiKoi6XKvw9WFpl+X15oY9xUcdPSTFGcqyUlEt6fIqiKKp05Uw2cOrOkLu7uzp06KCYmBirzRijmJgYBQUFOTPUBR0TAAAAAM7FqTBUu3Ztubm5KTk52aE9OTlZfn5+ZZpAWcb08PCQj4+PQwEAAACAMyrlanLjx49Xenq6VYmJiRU9JQAAAACVjFNhKDU1VSdPnpSvr69Du6+vr5KSkso0gbKMGRYWpurVq1vVoEGDMh0bAAAAgH05FYby8/O1YcMGBQcHW20uLi4KDg5WbGxsmSZQljHz8vKUkZHhUAAAAADgDDdndwgPD1dUVJTWr1+vdevWadSoUfL29lZkZKQkKSoqSomJiZowYYKk0wsktG7dWtLpz/o0aNBAAQEByszMVHx8fKnGBAAAAIDy5nQY+uKLL1SnTh1NnjxZfn5+2rRpk3r37q2UlBRJUsOGDVVQUGD1r1+/vjZt2mQ9HjNmjMaMGaOVK1eqZ8+epRoTAAAAAMqbi06vsV2p+fj4KD09XdWrV+ctcwBsqfD3YGmV5fflhT7GRR3/8GGpbl3HDikp0hlf9n2pjQ8AKB1nskGlXE0OAAAAAM4XYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALZUpDI0cOVIJCQnKyclRXFycOnXqdNb+AwYM0I4dO5STk6MtW7bo9ttvd9ju7e2tGTNmaP/+/crOzta2bdv0xBNPlGVqAAAAAFAqToehgQMHKjw8XJMmTVJgYKA2b96s6Oho1alTp9j+QUFBmj9/vmbPnq327dtryZIlWrJkidq0aWP1CQ8PV+/evfXQQw/pmmuu0bRp0zRz5kz16dOn7GcGAAAAAOdgnKm4uDgzY8YM67GLi4s5cOCAGTt2bLH9P//8c/P11187tMXGxppZs2ZZj7du3Wpefvllhz7r1683r776aqnm5OPjY4wxxsfHx6lzoSiKulyq8PdgaZXl9+WFPsZFHT8lxRjJsVJSLunxKYqiqNKVM9nATU5wd3dXhw4dFBYWZrUZYxQTE6OgoKBi9wkKClJ4eLhDW3R0tPr162c9XrNmje6++259/PHHOnjwoHr06KEWLVroueeeK3ZMDw8PeXp6Wo99fHycOQ0AuOg8PDw0fvz4UvcPCwtTXl7eBZwRKqMzf468srL04ltvOWx/84UXlO3tbT3m5wgAzq3UKatevXrGGGO6dOni0P7GG2+YuLi4YvfJzc01gwYNcmh78sknTVJSkvXYw8PDzJkzxxhjTF5enjlx4oT597//XeI8QkNDy+X/ElIURV2squx3VS6Hc7gc7gxx94miKOrc5cydoUtiNblnnnlGXbp0UZ8+fdShQwc9//zzioiIUHBwcLH9w8LCVL16dasaNGhwkWcMAAAAoLJz6m1yqampOnnypHx9fR3afX19lZSUVOw+SUlJZ+1ftWpVTZkyRffcc4++/fZbSdLWrVvVrl07vfDCC/rxxx+LjJmXl8dtfwAAAADnxak7Q/n5+dqwYYPDHRsXFxcFBwcrNja22H1iY2OL3OHp1auX1d/d3V0eHh4qKChw6HPq1Cm5ul4SN64AAAAAXIacujMknV4GOyoqSuvXr9e6des0atQoeXt7KzIyUpIUFRWlxMRETZgwQZI0ffp0rVq1SqNHj9ayZcs0aNAgdezYUY8//rgkKSMjQytXrtTUqVOVk5OjvXv3qnv37hoyZIhGjx5djqcKAAAAAP/H6TD0xRdfqE6dOpo8ebL8/Py0adMm9e7dWykpKZKkhg0bOtzliY2N1eDBg/Xaa69pypQp+uuvv9SvXz9t27bN6jNo0CCFhYVp7ty5qlWrlvbu3auXXnpJ77//fjmcIgAAAAAU5XQYkqSIiAhFREQUu61nz55F2hYuXKiFCxeWOF5ycrKGDx9elqkAAAAAQJnwoRwAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtkQYAgAAAGBLhCEAAAAAtlSmMDRy5EglJCQoJydHcXFx6tSp01n7DxgwQDt27FBOTo62bNmi22+/vUifVq1aaenSpTp27JgyMzO1bt06XX311WWZHgAAAACck9NhaODAgQoPD9ekSZMUGBiozZs3Kzo6WnXq1Cm2f1BQkObPn6/Zs2erffv2WrJkiZYsWaI2bdpYfZo0aaJff/1Vf/75p3r06KHrrrtOr776qk6cOFH2MwMAAACAczDOVFxcnJkxY4b12MXFxRw4cMCMHTu22P6ff/65+frrrx3aYmNjzaxZs6zH8+fPN5988olT8zizfHx8jDHG+Pj4lHkMiqKoC1mFv6dKy9nfZxd6/MvhHBzGT0kxRnKslJRLevyLdQyKoqjKXs5kA6fuDLm7u6tDhw6KiYmx2owxiomJUVBQULH7BAUFOfSXpOjoaKu/i4uL7rzzTu3atUvLly9XcnKy4uLi1Ldv3xLn4eHhIR8fH4cCAAAAAGc4FYZq164tNzc3JScnO7QnJyfLz8+v2H38/PzO2r9u3bry8fHRuHHjtHz5ct16661avHixFi1apJtuuqnYMcePH6/09HSrEhMTnTkNAAAAAKj41eRcXU9PYenSpZo2bZo2b96sN954Q998841GjBhR7D5hYWGqXr26VQ0aNLiYUwYAAABwGXBzpnNqaqpOnjwpX19fh3ZfX18lJSUVu09SUtJZ+6empio/P1/bt2936LNjxw7deOONxY6Zl5envLw8Z6YOAAAAAA6cujOUn5+vDRs2KDg42GpzcXFRcHCwYmNji90nNjbWob8k9erVy+qfn5+v3377TS1btnTo06JFC+3du9eZ6QEAAABAqTl1Z0iSwsPDFRUVpfXr12vdunUaNWqUvL29FRkZKUmKiopSYmKiJkyYIEmaPn26Vq1apdGjR2vZsmUaNGiQOnbsqMcff9wac+rUqVqwYIF+/vlnrVixQr1791afPn3Uo0eP8jlLAAAAAPgHp8PQF198oTp16mjy5Mny8/PTpk2b1Lt3b6WkpEiSGjZsqIKCAqt/bGysBg8erNdee01TpkzRX3/9pX79+mnbtm1WnyVLlmjEiBEaP3683n33Xe3cuVP9+/fX6tWry+EUAQAAAKAop8OQJEVERCgiIqLYbT179izStnDhQi1cuPCsY0ZGRlp3lwAAAADgQqvw1eQAAAAAoCIQhgAAAADYEmEIAAAAgC0RhgAAAADYEmEIAAAAgC0RhgAAAADYEmEIAAAAgC0RhgAAAADYEmEIAAAAgC0RhgAAAADYEmEIAAAAgC0RhgAAAADYEmEIAAAAgC0RhgAAAADYEmEIAAAAgC0RhgAAAADYkltFTwAALgUeHh4aP358qfuHhYUpLy/vAs4IuPjOfB14ZWXpxbfectj+5gsvKNvb23rM6wBAZUcYAgBJnp6emjhxYqn7h4eH80cgLjsOr4PDh6V/hKEXX3xRqlPHeszrAEBlx9vkAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANhSmcLQyJEjlZCQoJycHMXFxalTp05n7T9gwADt2LFDOTk52rJli26//fYS+86aNUvGGIWEhJRlagAAAABQKk6HoYEDByo8PFyTJk1SYGCgNm/erOjoaNWpU6fY/kFBQZo/f75mz56t9u3ba8mSJVqyZInatGlTpG+/fv3UpUsXJSYmOn8mAAAAAOAEp8PQ6NGj9eGHH2rOnDnasWOHRowYoezsbA0fPrzY/iEhIVq+fLneeust/fnnn3rllVe0ceNGPf300w796tevrxkzZujBBx9Ufn5+2c4GAAAAAErJqTDk7u6uDh06KCYmxmozxigmJkZBQUHF7hMUFOTQX5Kio6Md+ru4uOjTTz/V1KlTtX37dmemBAAAAABl4uZM59q1a8vNzU3JyckO7cnJyWrVqlWx+/j5+RXb38/Pz3o8duxYnTx5Uu+++26p5uHh4SFPT0/rsY+PT2lPAQAAAAAkXQKryQUGBiokJETDhg0r9T7jx49Xenq6VXzGCAAAAICznApDqampOnnypHx9fR3afX19lZSUVOw+SUlJZ+3frVs31a1bV/v27VN+fr7y8/PVqFEjvf3220pISCh2zLCwMFWvXt2qBg0aOHMaAAAAAOBcGMrPz9eGDRsUHBxstbm4uCg4OFixsbHF7hMbG+vQX5J69epl9f/000913XXXqV27dlYlJiZq6tSpuu2224odMy8vTxkZGQ4FAAAAAM5w6jNDkhQeHq6oqCitX79e69at06hRo+Tt7a3IyEhJUlRUlBITEzVhwgRJ0vTp07Vq1SqNHj1ay5Yt06BBg9SxY0c9/vjjkqS0tDSlpaU5HCM/P19JSUnatWvX+Z4fAAAAABTL6TD0xRdfqE6dOpo8ebL8/Py0adMm9e7dWykpKZKkhg0bqqCgwOofGxurwYMH67XXXtOUKVP0119/qV+/ftq2bVv5nQUAAAAAOMnpMCRJERERioiIKHZbz549i7QtXLhQCxcuLPX4jRs3Lsu0AAAAAKDUKnw1OQAAAACoCIQhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS4QhAAAAALZEGAIAAABgS24VPQEAOBcPDw+NHz++1P3DwsKUl5d3AWcEoCy8q3nqswn/liR5ZOXojtfnOmz/dtyDyvOuZj1+aMqnysrJvahzBGAvhCEAlzxPT09NnDix1P3Dw8MJQ8AlyMermtq7H5IkuboVDTnXuiWrwN3ToT9hCMCFxNvkAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANhSmcLQyJEjlZCQoJycHMXFxalTp05n7T9gwADt2LFDOTk52rJli26//XZrm5ubm15//XVt2bJFmZmZSkxMVFRUlOrVq1eWqQEAAABAqTgdhgYOHKjw8HBNmjRJgYGB2rx5s6Kjo1WnTp1i+wcFBWn+/PmaPXu22rdvryVLlmjJkiVq06aNJMnLy0uBgYF69dVXFRgYqHvvvVctW7bU//73v/M7MwAAAAA4C6fD0OjRo/Xhhx9qzpw52rFjh0aMGKHs7GwNHz682P4hISFavny53nrrLf3555965ZVXtHHjRj399NOSpPT0dN1666368ssvtWvXLq1du1ZPP/20OnbsqKuvvvr8zg4AAAAASuBUGHJ3d1eHDh0UExNjtRljFBMTo6CgoGL3CQoKcugvSdHR0SX2l6QaNWqooKBAx44dK3a7h4eHfHx8HAoAAAAAnOFUGKpdu7bc3NyUnJzs0J6cnCw/P79i9/Hz83Oqv6enp9544w3Nnz9fGRkZxfYZP3680tPTrUpMTHTmNAAAAADg0lpNzs3NTV988YVcXFz05JNPltgvLCxM1atXt6pBgwYXcZYAAAAALgduznROTU3VyZMn5evr69Du6+urpKSkYvdJSkoqVf/CIOTv76+bb765xLtCkpSXl6e8vDxnpg4AAAAADpy6M5Sfn68NGzYoODjYanNxcVFwcLBiY2OL3Sc2NtahvyT16tXLoX9hEGrevLluueUWpaWlOTMtAAAAAHCaU3eGJCk8PFxRUVFav3691q1bp1GjRsnb21uRkZGSpKioKCUmJmrChAmSpOnTp2vVqlUaPXq0li1bpkGDBqljx456/PHHT0/AzU0LFy5UYGCg7rrrLlWpUsW6k5SWlqb8/PzyOlcAAAAAsDgdhr744gvVqVNHkydPlp+fnzZt2qTevXsrJSVFktSwYUMVFBRY/WNjYzV48GC99tprmjJliv766y/169dP27ZtkyQ1aNBAffv2lSRt3rzZ4Vg9evTQqlWrynxyAAAAAFASp8OQJEVERCgiIqLYbT179izStnDhQi1cuLDY/nv37pWLi0tZpgEAAAAAZXZJrSYHAAAAABcLYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANgSYQgAAACALRGGAAAAANiSW0VPAEDl5+HhofHjx5e6f1hYmPLy8i7gjADYlXc1T3024d+SJI+sHN3x+lyH7d+Oe1B53tWsxw9N+VRZObkXdY4ALh2EIQDnzdPTUxMnTix1//DwcMIQgAvCx6ua2rsfkiS5uhUNOde6JavA3dOhP2EIsC/eJgcAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGzJraInAODC8/Dw0Pjx40vdPywsTHl5eRdwRgBQOXlX89RnE/4tSfLIytEdr8912P7tuAeV513NevzQlE+VlZN7UecIoPQIQ4ANeHp6auLEiaXuHx4eThgCgGL4eFVTe/dDkiRXt6Ih51q3ZBW4ezr0JwwBly7eJgcAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGyJMAQAAADAlghDAAAAAGypTEtrjxw5UmPGjJGfn582b96sZ555Rr/99luJ/QcMGKBXX31VjRo10l9//aWxY8fqu+++c+gzadIkPfbYY/rXv/6l1atX68knn9Tff/9dlukBlQrfAQQAKMT3GAEXl9NhaODAgQoPD9eIESO0du1ajRo1StHR0WrZsqUOHz5cpH9QUJDmz5+v8ePH65tvvtHgwYO1ZMkSBQYGatu2bZKkF198Uc8++6yGDh2qhIQEvfrqq4qOjlbr1q2Vm8sLHJc3vgMIAFCI7zECLi6n3yY3evRoffjhh5ozZ4527NihESNGKDs7W8OHDy+2f0hIiJYvX6633npLf/75p1555RVt3LhRTz/9tNVn1KhReu211/S///1PW7du1ZAhQ1S/fn3169evzCcGAAAAAGfj1J0hd3d3dejQQWFhYVabMUYxMTEKCgoqdp+goCCFh4c7tEVHR1tBp3HjxqpXr55iYmKs7enp6Vq7dq2CgoK0YMECZ6YIlDvexgYAuFzwNjzAkVNhqHbt2nJzc1NycrJDe3Jyslq1alXsPn5+fsX29/Pzs7YXtpXU5588PDzk6XnGLWIfH2dOA5eZCx1WeBsbAOBycTHehkfgQmVSpgUUKtr48eOd+uMUOB+5ublO/bw5+zm3Cz3+xThGZR//Yhyjso9/MY5x0ccPDXXsEBFxSY9/MY5xocfPyM7R7/n1Tj/wlDa8+mjRTvmO/Z11oY/B+M7J866mJcUdA7iEmNKWu7u7yc/PN3379nVonzNnjlmyZEmx++zdu9eEhIQ4tE2cONFs2rTJSDKNGzc2xhgTEBDg0GflypVm2rRpxY7p4eFhfHx8rKpfv74xxhgfH59SnwtFURRFURRFUZdf+fj4lDobOLWAQn5+vjZs2KDg4GCrzcXFRcHBwYqNjS12n9jYWIf+ktSrVy+rf0JCgg4dOuTQx8fHR507dy5xzLy8PGVkZDgUAAAAADjLqaQ1cOBAk5OTY4YMGWJatWpl3n//fZOWlmbq1q1rJJmoqCgzZcoUq39QUJDJy8szo0ePNi1btjShoaEmNzfXtGnTxurz4osvmrS0NNOnTx/Ttm1bs3jxYhMfH288PT3LPf1RFEVRFEVRFHX5lpPZwPkDPPXUU2bPnj3mxIkTJi4uzlx//fXWthUrVpjIyEiH/gMGDDB//vmnOXHihNm6dau5/fbbi4w5adIkc+jQIZOTk2N++OEH07x58wt1whRFURRFURRFXablTDZw+X//qNR8fHyUnp6u6tWr85Y5AAAAwMacyQZOf+kqAAAAAFwOCEMAAAAAbIkwBAAAAMCWCEMAAAAAbIkwBAAAAMCWCEMAAAAAbIkwBAAAAMCWCEMAAAAAbIkwBAAAAMCWCEMAAAAAbMmtoidQnnx8fCp6CgAAAAAqkDOZ4LIIQ4UnnJiYWMEzAQAAAHAp8PHxUUZGxln7uEgyF2c6F1b9+vXPebLS6SclMTFRDRo0KFV/VE5c58sf19geuM6XP66xPXCdL3+X2jX28fHRwYMHz9nvsrgzJKlUJ3umjIyMS+JC4cLiOl/+uMb2wHW+/HGN7YHrfPm7VK5xaefAAgoAAAAAbIkwBAAAAMCWbBeGcnNzNXHiROXm5lb0VHABcZ0vf1xje+A6X/64xvbAdb78VdZrfNksoAAAAAAAzrDdnSEAAAAAkAhDAAAAAGyKMAQAAADAlghDAAAAAGzJdmFo5MiRSkhIUE5OjuLi4tSpU6eKnhLKUWhoqIwxDrVjx46KnhbOQ7du3fS///1PiYmJMsaob9++RfpMmjRJBw8eVHZ2tn744Qc1a9asAmaK83Gu6xwZGVnktf3dd99V0GxRFuPGjdO6deuUnp6u5ORkLV68WC1atHDo4+npqZkzZyo1NVUZGRlauHCh6tatW0EzhrNKc41XrFhR5LU8a9asCpoxymLEiBHavHmzjh8/ruPHj2vNmjXq3bu3tb2yvY5tFYYGDhyo8PBwTZo0SYGBgdq8ebOio6NVp06dip4aytEff/whPz8/q2688caKnhLOg7e3tzZv3qynnnqq2O0vvviinn32WY0YMUKdO3dWVlaWoqOj5enpeZFnivNxrussSd99953Da/uBBx64iDPE+erevbsiIiLUpUsX9erVS+7u7vr+++/l5eVl9XnnnXfUp08f3Xffferevbvq16+vRYsWVeCs4YzSXGNJ+uCDDxxeyy+++GIFzRhlceDAAY0bN04dOnRQx44d9dNPP2np0qVq3bq1pMr5OjZ2qbi4ODNjxgzrsYuLizlw4IAZO3Zshc+NKp8KDQ01v//+e4XPg7owZYwxffv2dWg7ePCgef75563H1atXNzk5Oeb++++v8PlS5XedIyMjzeLFiyt8blT5Ve3atY0xxnTr1s1Ip1+7ubm5pn///lafli1bGmOM6dy5c4XPlzr/ayzJrFixwrzzzjsVPjeqfOvIkSNm+PDhlfJ1bJs7Q+7u7urQoYNiYmKsNmOMYmJiFBQUVIEzQ3lr3ry5EhMTFR8fr88++0xXX311RU8JF0jjxo1Vr149h9d1enq61q5dy+v6MtSjRw8lJyfrzz//1HvvvadatWpV9JRwHmrUqCFJSktLkyR16NBBHh4eDq/nnTt3au/evbyeK6l/XuNCDz74oA4fPqytW7dqypQpqlatWkVMD+XA1dVV999/v7y9vRUbG1spX8duFT2Bi6V27dpyc3NTcnKyQ3tycrJatWpVQbNCeVu7dq2GDRumnTt3ql69egoNDdUvv/yitm3bKjMzs6Knh3Lm5+cnScW+rgu34fKwfPlyLVq0SAkJCWratKmmTJmi7777TkFBQSooKKjo6cFJLi4umjZtmn799Vdt27ZN0unXc25uro4fP+7Ql9dz5VTcNZakefPmae/evTp48KCuu+46vfHGG2rZsqX69+9fgbOFs9q2bavY2FhVrVpVmZmZuueee7Rjxw61a9eu0r2ObROGYA/Lly+3/r1161atXbtWe/fu1cCBA/Xxxx9X4MwAnI8FCxZY//7jjz+0ZcsW7d69Wz169NBPP/1UgTNDWURERKht27Z8pvMyVtI1/vDDD61///HHHzp06JB++uknNWnSRLt3777Y00QZ7dy5U+3atVONGjU0YMAARUVFqXv37hU9rTKxzdvkUlNTdfLkSfn6+jq0+/r6KikpqYJmhQvt+PHj2rVrF6uLXaYKX7u8ru0nISFBhw8f5rVdCc2YMUN33XWXevbsqcTERKs9KSlJnp6e1lurCvF6rnxKusbFWbt2rSTxWq5k8vPzFR8fr40bN2rChAnavHmzQkJCKuXr2DZhKD8/Xxs2bFBwcLDV5uLiouDgYMXGxlbgzHAheXt7q2nTpjp06FBFTwUXQEJCgg4dOuTwuvbx8VHnzp15XV/mGjRooCuvvJLXdiUzY8YM3XPPPbr55pu1Z88eh20bNmxQXl6ew+u5RYsW8vf35/VciZztGhenXbt2ksRruZJzdXWVp6dnpX0dV/gqDherBg4caHJycsyQIUNMq1atzPvvv2/S0tJM3bp1K3xuVPnU1KlTzU033WT8/f1NUFCQ+f77701KSoqpXbt2hc+NKlt5e3ubgIAAExAQYIwxZtSoUSYgIMBcffXVRpJ58cUXTVpamunTp49p27atWbx4sYmPjzeenp4VPneqfK6zt7e3efPNN03nzp2Nv7+/ufnmm8369evNzp07jYeHR4XPnSpdRUREmKNHj5qbbrrJ+Pr6WlW1alWrz3vvvWf27NljevToYQIDA83q1avN6tWrK3zuVPlc4yZNmpiXX37ZBAYGGn9/f9OnTx/z999/m5UrV1b43KnS15QpU0y3bt2Mv7+/adu2rZkyZYo5deqUueWWW4xUKV/HFT6Bi1pPPfWU2bNnjzlx4oSJi4sz119/fYXPiSq/mj9/vklMTDQnTpww+/fvN/PnzzdNmjSp8HlRZa/u3bub4kRGRlp9Jk2aZA4dOmRycnLMDz/8YJo3b17h86bK7zpXrVrVLF++3CQnJ5vc3FyTkJBg/vvf//I/sipZlWTo0KFWH09PTzNz5kxz5MgRk5mZab766ivj6+tb4XOnyucaX3XVVWblypUmNTXV5OTkmF27dpk33njD+Pj4VPjcqdLXRx99ZBISEsyJEydMcnKy+eGHH6wgJFW+17HL//sHAAAAANiKbT4zBAAAAABnIgwBAAAAsCXCEAAAAABbIgwBAAAAsCXCEAAAAABbIgwBAAAAsCXCEAAAAABbIgwBAAAAsCXCEAAAAABbIgwBAAAAsCXCEAAAAABbIgwBAAAAsKX/Hx2Ta+wCneIKAAAAAElFTkSuQmCC"
770
    }
771
   },
772
   "cell_type": "markdown",
773
   "id": "c9b86bbc",
774
   "metadata": {},
775
   "source": [
776
    "![pvalue.png](attachment:pvalue.png)"
777
   ]
778
  },
779
  {
780
   "cell_type": "markdown",
781
   "id": "cc7e3819",
782
   "metadata": {},
783
   "source": [
784
    "Научимся считать p-value. Будем итеративно по строчкам расписывать формулу, добавляя кусочки определения.\n",
785
    "\n",
786
    "p-value &mdash; это **вероятность**\n",
787
    "\n",
788
    "$$ P( $$\n",
789
    "\n",
790
    "**при справедливости $\\mathsf{H}_0$** (в нашем примере, статистика имеет биномиальное распределение с вероятностью успеха 0.5)\n",
791
    "\n",
792
    "$$ P_{\\mathsf{H}_0}( $$\n",
793
    "\n",
794
    "получить **такое же** значение **статистики** или **более экстремальное** (в нашем случае значит большее либо равное)\n",
795
    "\n",
796
    "$$ P_{\\mathsf{H}_0}(Q \\geqslant q) $$\n",
797
    "\n",
798
    "Теперь выведем формулу через функции Python:\n",
799
    "\n",
800
    "$$ pvalue(q) = P_{\\mathsf{H}_0}(Q \\geqslant q) = 1 - P_{\\mathsf{H}_0}(Q < q) =  1 - P_{\\mathsf{H}_0}(Q \\leqslant q - 1) = 1 - \\text{binom_h0.cdf(q - 1)}$$"
801
   ]
802
  },
803
  {
804
   "cell_type": "markdown",
805
   "id": "c0ca6092",
806
   "metadata": {},
807
   "source": [
808
    "Изобразим на графике область более экстремальных значений и p-value для разных значений статистики."
809
   ]
810
  },
811
  {
812
   "cell_type": "code",
813
   "execution_count": 18,
814
   "id": "2cddff27",
815
   "metadata": {},
816
   "outputs": [],
817
   "source": [
818
    "C = 20  # критическое значение\n",
819
    "qs = [10, 19, 20, 23]  # разные реализации статистики"
820
   ]
821
  },
822
  {
823
   "cell_type": "code",
824
   "execution_count": 19,
825
   "id": "a7f57994",
826
   "metadata": {},
827
   "outputs": [
828
    {
829
     "data": {
830
      "image/png": "\n",
831
      "text/plain": [
832
       "<Figure size 1152x576 with 4 Axes>"
833
      ]
834
     },
835
     "metadata": {
836
      "needs_background": "dark"
837
     },
838
     "output_type": "display_data"
839
    }
840
   ],
841
   "source": [
842
    "fig, axes = pyplot.subplots(2, 2, figsize=(16, 8))\n",
843
    "\n",
844
    "for q, ax in zip(qs, axes.flatten()):\n",
845
    "    ax.set_title(f'$q = {q}$' + (' [our experiment]' if q == 19 else ''))\n",
846
    "    # строим вертикальные столбцы от 0 до вероятности\n",
847
    "    ax.vlines(x_grid, 0, probs, linewidth=8.0, color='white', label='PMF, $Binom(0.5, 30)$')\n",
848
    "    # отдельно изобразим критическую области критерия\n",
849
    "    crit_reg = x_grid >= 20\n",
850
    "    ax.vlines(x_grid[crit_reg], 0, probs[crit_reg], linewidth=8.0, label='Critical region for S')\n",
851
    "\n",
852
    "    # посчитаем площадь более экстремальных значений\n",
853
    "    pvalue = 1 - binom_h0.cdf(q - 1)\n",
854
    "    # изобразим такие же и более экстремальные значения на графике\n",
855
    "    more_extremal = x_grid >= q\n",
856
    "    ax.vlines(\n",
857
    "        x_grid[more_extremal], 0, probs[more_extremal], linewidth=3.0, color='red',\n",
858
    "        label='q or more extremal pvalue: {:.3f}'.format(pvalue)\n",
859
    "    )\n",
860
    "    ax.legend()\n",
861
    "\n",
862
    "pyplot.suptitle('P-values for different q', fontsize=20)\n",
863
    "pyplot.show()"
864
   ]
865
  },
866
  {
867
   "cell_type": "markdown",
868
   "id": "2222100c",
869
   "metadata": {},
870
   "source": [
871
    "Можно увидеть, что в критической области $p-value \\leqslant \\alpha$, а вне её $p-value > \\alpha$. Именно такое правило и используется для принятия решения\n",
872
    "\n",
873
    "$$ \\mathsf{H}_0 \\text{ отвергается } \\Leftrightarrow p-value \\leqslant \\alpha $$\n",
874
    "\n",
875
    "Причём по p-value сразу видно, что если бы в нашу критическую области включили значение $19$, наш критерий допускал бы False Positive в $10\\%$ случаев, что уже недопустимо. Поэтому и гипотезу мы не отвергаем.\n",
876
    "\n",
877
    "Заметим, что для вычисления p-value не понадобилось знание $\\alpha$, а нужна была только статистика и форма критерия."
878
   ]
879
  },
880
  {
881
   "cell_type": "markdown",
882
   "id": "213b0c46",
883
   "metadata": {},
884
   "source": [
885
    "## Часть 5. Двусторонные критерии"
886
   ]
887
  },
888
  {
889
   "cell_type": "markdown",
890
   "id": "f4dbaf1d",
891
   "metadata": {},
892
   "source": [
893
    "До этого момента нас интересовали отклонения от вероятности в $50\\%$ только в одну сторону. И логично, ведь это продиктовано бизнес-смыслом. Только большая доля успешных доставок приведёт к успеху. И обычно при принятии решений так и бывает. **При тестировании нового решения или продукта рассматривают альтернативную гипотезу только в сторону улучшения**, потому что в противном случае нет смысла внедрять решение на всех пользователей.\n",
894
    "\n",
895
    "\n",
896
    "Однако **иногда** может потребоваться доказывать отклонения в обе стороны, если вы проверяете какое-то предположение. Пусть вам дали монетку и просят проверить, честная она или нет. Монетка честная, если при подбрасываниях вероятность выпадения орла равна $0.5$. Вы подбрасываете монетку $30$ раз, каждый бросок &mdash; бернуллиевская величина, аналогично задаче с доставками. И нулевая гипотеза та же самая: $\\mu = 0.5$. Но теперь мы хотим отвергать эту  гипотезу как в случае большой вероятности орла, так и в случае маленькой, соответственно проверяем *двустороннюю гипотезу*.\n",
897
    "\n",
898
    "$$ \\mathsf{H}_0: \\mu = 0.5 $$\n",
899
    "$$ \\mathsf{H}_1: \\mu \\neq 0.5 $$\n",
900
    "\n",
901
    "Выберем критическую область для критерия при такой альтернативе. Воспользуемся той же статистикой $Q(\\xi) = \\sum \\xi_i$. Только теперь отклонения в каждую сторону одинаково важны. Отвергать гипотезу будем не только на достаточно больших значениях, но и на достаточно маленьких. Например, если у нас было всего $2$ орла из $30$ &mdash; это свидетельство в пользу того, что $\\mu \\neq 0.5$, но не в пользу $\\mu > 0.5$.\n",
902
    "\n",
903
    "Поскольку отклонения в разные стороны одинаково важны, а распределение симметричное, искать критерий можно в таком виде:\n",
904
    "\n",
905
    "$$ S = \\{|Q(\\xi) - 15| \\geqslant C\\} $$"
906
   ]
907
  },
908
  {
909
   "cell_type": "markdown",
910
   "id": "30ae5513",
911
   "metadata": {},
912
   "source": [
913
    "### Как выбрать критическую область"
914
   ]
915
  },
916
  {
917
   "cell_type": "markdown",
918
   "id": "da983184",
919
   "metadata": {},
920
   "source": [
921
    "Посмотрим, как будет выглядеть критическая область в таком случае."
922
   ]
923
  },
924
  {
925
   "cell_type": "code",
926
   "execution_count": 20,
927
   "id": "9da5f643",
928
   "metadata": {},
929
   "outputs": [
930
    {
931
     "data": {
932
      "image/png": "\n",
933
      "text/plain": [
934
       "<Figure size 1152x576 with 1 Axes>"
935
      ]
936
     },
937
     "metadata": {
938
      "needs_background": "dark"
939
     },
940
     "output_type": "display_data"
941
    }
942
   ],
943
   "source": [
944
    "C = 6\n",
945
    "\n",
946
    "pyplot.figure(figsize=(16, 8))\n",
947
    "\n",
948
    "# строим вертикальные столбцы от 0 до вероятности\n",
949
    "pyplot.vlines(x_grid, 0, probs, linewidth=15.0, color='white', label='PMF, $Binom(0.5, 30)$')\n",
950
    "# отдельно изобразим критическую области критерия\n",
951
    "crit_reg = numpy.abs(x_grid - 15) >= C\n",
952
    "pyplot.vlines(x_grid[crit_reg], 0, probs[crit_reg], linewidth=15.0, label='Critical region for S')\n",
953
    "\n",
954
    "rejection_prob = probs[crit_reg].sum()\n",
955
    "pyplot.title('Two-sided criteria, C = {}, critical region proba = {:.3f}'.format(C, rejection_prob), fontsize=20)\n",
956
    "pyplot.legend(fontsize=18)\n",
957
    "pyplot.show()"
958
   ]
959
  },
960
  {
961
   "cell_type": "markdown",
962
   "id": "b9f40b8a",
963
   "metadata": {},
964
   "source": [
965
    "По картинке видно, что если теперь отвергать отклонения при $Q \\geqslant 20$, то необходимо отвергать и $Q \\leqslant 10$, а значит общая площадь столбцов будет уже примерно $0.1$. Поэтому при уровне значимости $0.05$ и $20$ успехах гипотеза уже не отвергнется.\n",
966
    "\n",
967
    "Если же выставить $C = 6$, то такая область уже подходит, площадь столбцов $\\approx 0.043 < 0.05$\n",
968
    "\n",
969
    "Чтобы выбрать пороговую константу по формуле, можно заметить, что критическая область симметрична, а значит справа площадь не должна быть больше, чем $\\frac{\\alpha}{2}$. А такую задачу мы уже умеем решать. Реализуем функцию на Python."
970
   ]
971
  },
972
  {
973
   "cell_type": "code",
974
   "execution_count": 24,
975
   "id": "0c23c057",
976
   "metadata": {},
977
   "outputs": [],
978
   "source": [
979
    "def make_binom_criterion_two_sided(n, alpha=0.05):\n",
980
    "    '''Строит критерий для задачи с доставкой для mu = 0.5 и двусторонней альтернативы\n",
981
    "    \n",
982
    "    Параметры:\n",
983
    "        n: количество доставок в эксперименте\n",
984
    "        mu: вероятность успеха в нулевой гипотезе\n",
985
    "        alpha: уровень значимости критерия\n",
986
    "        \n",
987
    "    Возвращает:\n",
988
    "        C для критерия S = {|Q - 15| >= C}\n",
989
    "    '''\n",
990
    "    # определяем границу справа для alpha / 2\n",
991
    "    right_crit_val = make_binom_criterion(n, mu=0.5, alpha = alpha / 2)\n",
992
    "    # считаем отклонение, начиная с которого отвергать\n",
993
    "    diff = right_crit_val - 15\n",
994
    "    return diff"
995
   ]
996
  },
997
  {
998
   "cell_type": "code",
999
   "execution_count": 25,
1000
   "id": "19e0a4a2",
1001
   "metadata": {},
1002
   "outputs": [
1003
    {
1004
     "data": {
1005
      "text/plain": [
1006
       "6.0"
1007
      ]
1008
     },
1009
     "execution_count": 25,
1010
     "metadata": {},
1011
     "output_type": "execute_result"
1012
    }
1013
   ],
1014
   "source": [
1015
    "make_binom_criterion_two_sided(30)"
1016
   ]
1017
  },
1018
  {
1019
   "cell_type": "markdown",
1020
   "id": "7cc06fbe",
1021
   "metadata": {},
1022
   "source": [
1023
    "Получили то же, что и по картинке."
1024
   ]
1025
  },
1026
  {
1027
   "cell_type": "markdown",
1028
   "id": "c7f18323",
1029
   "metadata": {},
1030
   "source": [
1031
    "### Как считать p-value"
1032
   ]
1033
  },
1034
  {
1035
   "cell_type": "markdown",
1036
   "id": "16e7cf34",
1037
   "metadata": {},
1038
   "source": [
1039
    "Критерий имеет вид\n",
1040
    "\n",
1041
    "$$ S = \\{|Q(\\xi) - 15| \\geqslant C\\} $$\n",
1042
    "\n",
1043
    "Обозначим отклонение суммы от 15 как $ \\Delta(\\xi) =  |Q(\\xi) - 15| $, тогда мы имеем критерий\n",
1044
    "\n",
1045
    "$$ S = \\{\\Delta(\\xi) \\geqslant C\\} $$\n",
1046
    "\n",
1047
    "То есть более экстремальными будут считаться те значения суммы, которые находятся дальше от 15. Чтобы вычислить p-value, придётся посчитать сумму площадей с двух сторон по-отдельности."
1048
   ]
1049
  },
1050
  {
1051
   "cell_type": "code",
1052
   "execution_count": 26,
1053
   "id": "72d27d8f",
1054
   "metadata": {},
1055
   "outputs": [],
1056
   "source": [
1057
    "def pvalue_two_sided_sym(n, q):\n",
1058
    "    '''Считает pvalue для задачи с доставкой для mu = 0.5 и двусторонней альтернативы\n",
1059
    "    \n",
1060
    "    Параметры:\n",
1061
    "        n: количество доставок в эксперименте\n",
1062
    "        q: количество успешных доставок\n",
1063
    "        \n",
1064
    "    Возвращает:\n",
1065
    "        pvalue для критерия S = {|Q - 15| >= C}\n",
1066
    "    '''\n",
1067
    "    binom_h0 = binom(n=n, p=0.5)\n",
1068
    "    diff = numpy.abs(q - 15)\n",
1069
    "    # смотрим более экстремальные отклонения с правой стороны\n",
1070
    "    right_sq = 1 - binom_h0.cdf(15 + diff - 1)\n",
1071
    "    # смотрим более экстремальные отклонения с левой стороны\n",
1072
    "    left_sq = binom_h0.cdf(15 - diff)\n",
1073
    "    return left_sq + right_sq"
1074
   ]
1075
  },
1076
  {
1077
   "cell_type": "markdown",
1078
   "id": "ea134659",
1079
   "metadata": {},
1080
   "source": [
1081
    "На самом деле в силу симметричности распределения левая и правая площадь получаются одинаковыми, поэтому можно посчитать площадь с одной стороны и умножить на 2."
1082
   ]
1083
  },
1084
  {
1085
   "cell_type": "code",
1086
   "execution_count": 27,
1087
   "id": "33cf3e33",
1088
   "metadata": {},
1089
   "outputs": [],
1090
   "source": [
1091
    "def pvalue_two_sided_sym_simple(n, q):\n",
1092
    "    '''Считает pvalue для задачи с доставкой для mu = 0.5 и двусторонней альтернативы\n",
1093
    "    \n",
1094
    "    Параметры:\n",
1095
    "        n: количество доставок в эксперименте\n",
1096
    "        q: количество успешных доставок\n",
1097
    "        \n",
1098
    "    Возвращает:\n",
1099
    "        pvalue для критерия S = {|Q - 15| >= C}\n",
1100
    "    '''\n",
1101
    "    binom_h0 = binom(n=n, p=0.5)\n",
1102
    "    diff = numpy.abs(q - 15)\n",
1103
    "    # смотрим более экстремальные отклонения с правой стороны\n",
1104
    "    right_sq = 1 - binom_h0.cdf(15 + diff - 1)\n",
1105
    "    return 2 * right_sq"
1106
   ]
1107
  },
1108
  {
1109
   "cell_type": "code",
1110
   "execution_count": 28,
1111
   "id": "ab687f0c",
1112
   "metadata": {},
1113
   "outputs": [
1114
    {
1115
     "data": {
1116
      "text/plain": [
1117
       "0.04277394525706768"
1118
      ]
1119
     },
1120
     "execution_count": 28,
1121
     "metadata": {},
1122
     "output_type": "execute_result"
1123
    }
1124
   ],
1125
   "source": [
1126
    "pvalue_two_sided_sym(n=30, q=21)"
1127
   ]
1128
  },
1129
  {
1130
   "cell_type": "code",
1131
   "execution_count": 29,
1132
   "id": "035237ba",
1133
   "metadata": {},
1134
   "outputs": [
1135
    {
1136
     "data": {
1137
      "text/plain": [
1138
       "0.04277394525706768"
1139
      ]
1140
     },
1141
     "execution_count": 29,
1142
     "metadata": {},
1143
     "output_type": "execute_result"
1144
    }
1145
   ],
1146
   "source": [
1147
    "pvalue_two_sided_sym_simple(n=30, q=21)"
1148
   ]
1149
  },
1150
  {
1151
   "cell_type": "markdown",
1152
   "id": "91732314",
1153
   "metadata": {},
1154
   "source": [
1155
    "Теперь даже в случае $20$ орлов $pvalue > 0.05$, поэтому отвергать будем значения, начиная с $21$ и меньше либо равные $9$."
1156
   ]
1157
  },
1158
  {
1159
   "cell_type": "markdown",
1160
   "id": "064494b6",
1161
   "metadata": {},
1162
   "source": [
1163
    "### Случай с несимметричным распределением"
1164
   ]
1165
  },
1166
  {
1167
   "cell_type": "markdown",
1168
   "id": "609f31af",
1169
   "metadata": {},
1170
   "source": [
1171
    "Когда распределение при справедливости $\\mathsf{H}_0$ несимметрично, отклонения от ожидаемого значения в разные стороны могут быть по-разному критичны. В качестве примера рассмотрим также биномиальное распределение, но с вероятностью успеха $0.8$. \n",
1172
    "\n",
1173
    "Тогда можно левую и правую критические области построить отдельно, выделив на них по $\\frac{\\alpha}{2}$ площади. Правую область мы уже умеем искать, найдём левую."
1174
   ]
1175
  },
1176
  {
1177
   "cell_type": "code",
1178
   "execution_count": 16,
1179
   "id": "119b12d8",
1180
   "metadata": {},
1181
   "outputs": [],
1182
   "source": [
1183
    "binom_h0_nonsym = binom(\n",
1184
    "    n=30, # количество испытаний\n",
1185
    "    p=0.8 # вероятность успеха\n",
1186
    ")"
1187
   ]
1188
  },
1189
  {
1190
   "cell_type": "code",
1191
   "execution_count": 17,
1192
   "id": "b0b428de",
1193
   "metadata": {},
1194
   "outputs": [
1195
    {
1196
     "data": {
1197
      "image/png": "\n",
1198
      "text/plain": [
1199
       "<Figure size 1152x576 with 1 Axes>"
1200
      ]
1201
     },
1202
     "metadata": {
1203
      "needs_background": "dark"
1204
     },
1205
     "output_type": "display_data"
1206
    }
1207
   ],
1208
   "source": [
1209
    "pyplot.figure(figsize=(16, 8))\n",
1210
    "\n",
1211
    "# считаем вероятности значений суммы\n",
1212
    "probs = binom_h0_nonsym.pmf(x_grid)\n",
1213
    "# строим вертикальные столбцы от 0 до вероятности\n",
1214
    "pyplot.vlines(x_grid, 0, probs, linewidth=15.0, color='white', label='PMF, $Binom(0.8, 30)$')\n",
1215
    "\n",
1216
    "pyplot.title('Binomial distribution', fontsize=20)\n",
1217
    "pyplot.legend(fontsize=18)\n",
1218
    "pyplot.show()"
1219
   ]
1220
  },
1221
  {
1222
   "cell_type": "markdown",
1223
   "id": "561e5924",
1224
   "metadata": {},
1225
   "source": [
1226
    "Для того, чтобы построить двусторонний критерий, нужно найти слева и справа области, площадь которых составляет не больше, чем $\\frac{\\alpha}{2}$. Для правой стороны мы уже решали такую задачу, решим для левой.\n",
1227
    "\n",
1228
    "Ищем $C$, такое что\n",
1229
    "\n",
1230
    "$$ P(Q(\\xi) \\leqslant C) \\leqslant \\frac{\\alpha}{2} $$\n",
1231
    "\n",
1232
    "Сначала найдём первое число, где вероятность $\\geqslant \\frac{\\alpha}{2}$. А это по определению $\\frac{\\alpha}{2}$-квантиль. Достаточно взять предыдущее число, и оно будет удовлетворять нашему условию."
1233
   ]
1234
  },
1235
  {
1236
   "cell_type": "code",
1237
   "execution_count": 32,
1238
   "id": "ee4d5407",
1239
   "metadata": {},
1240
   "outputs": [],
1241
   "source": [
1242
    "def two_sided_criterion_nonsym(n, mu, alpha):\n",
1243
    "    '''Строит двусторонний критерий для несимметричной задачи с доставкой\n",
1244
    "    \n",
1245
    "    Параметры:\n",
1246
    "        n: количество доставок в эксперименте\n",
1247
    "        mu: вероятность успеха в нулевой гипотезе\n",
1248
    "        alpha: уровень значимости критерия\n",
1249
    "        \n",
1250
    "    Возвращает:\n",
1251
    "        C1, C2 для критерия S = {Q <= C1 или Q >= C2}\n",
1252
    "    '''\n",
1253
    "    binom_h0 = binom(n=n, p=mu)\n",
1254
    "    \n",
1255
    "    # аналогично одностороннему критерию\n",
1256
    "    c2 = binom_h0.ppf(1 - alpha/2) + 1\n",
1257
    "        \n",
1258
    "    # по выкладкам выше\n",
1259
    "    c1 = binom_h0.ppf(alpha/2) - 1\n",
1260
    "    \n",
1261
    "    return c1, c2"
1262
   ]
1263
  },
1264
  {
1265
   "cell_type": "code",
1266
   "execution_count": 33,
1267
   "id": "7c6ee411",
1268
   "metadata": {},
1269
   "outputs": [],
1270
   "source": [
1271
    "c1, c2 = two_sided_criterion_nonsym(30, 0.8, 0.05)"
1272
   ]
1273
  },
1274
  {
1275
   "cell_type": "code",
1276
   "execution_count": 34,
1277
   "id": "9a7d6b3a",
1278
   "metadata": {},
1279
   "outputs": [
1280
    {
1281
     "data": {
1282
      "text/plain": [
1283
       "(18.0, 29.0)"
1284
      ]
1285
     },
1286
     "execution_count": 34,
1287
     "metadata": {},
1288
     "output_type": "execute_result"
1289
    }
1290
   ],
1291
   "source": [
1292
    "c1, c2"
1293
   ]
1294
  },
1295
  {
1296
   "cell_type": "markdown",
1297
   "id": "9109aa9c",
1298
   "metadata": {},
1299
   "source": [
1300
    "Значит наш критерий для проверки гипотезы\n",
1301
    "\n",
1302
    "$$ \\mathsf{H}_0: \\mu = 0.8 $$\n",
1303
    "$$ \\mathsf{H}_1: \\mu \\neq 0.8 $$\n",
1304
    "\n",
1305
    "имеет вид\n",
1306
    "\n",
1307
    "$$ S = \\{Q(\\xi) \\leqslant 18\\} \\cup \\{Q(\\xi) \\geqslant 29\\}$$\n",
1308
    "\n",
1309
    "Здесь граница $29$ уже выглядит логично, потому что надо опровергнуть 80% орлов/успехов, а для этого требуется большое их количество."
1310
   ]
1311
  },
1312
  {
1313
   "cell_type": "markdown",
1314
   "id": "63e5d5a7",
1315
   "metadata": {},
1316
   "source": [
1317
    "Изобразим критическую область на графике."
1318
   ]
1319
  },
1320
  {
1321
   "cell_type": "code",
1322
   "execution_count": 35,
1323
   "id": "60dacea6",
1324
   "metadata": {},
1325
   "outputs": [
1326
    {
1327
     "data": {
1328
      "image/png": "\n",
1329
      "text/plain": [
1330
       "<Figure size 1152x576 with 1 Axes>"
1331
      ]
1332
     },
1333
     "metadata": {
1334
      "needs_background": "dark"
1335
     },
1336
     "output_type": "display_data"
1337
    }
1338
   ],
1339
   "source": [
1340
    "pyplot.figure(figsize=(16, 8))\n",
1341
    "\n",
1342
    "# считаем вероятности значений суммы\n",
1343
    "probs = binom_h0_nonsym.pmf(x_grid)\n",
1344
    "# строим вертикальные столбцы от 0 до вероятности\n",
1345
    "pyplot.vlines(x_grid, 0, probs, linewidth=15.0, color='white', label='PMF, $Binom(0.5, 30)$')\n",
1346
    "# отдельно изобразим критическую области критерия\n",
1347
    "crit_reg = (x_grid >= 29) | (x_grid <= 18)\n",
1348
    "pyplot.vlines(x_grid[crit_reg], 0, probs[crit_reg], linewidth=15.0, label='Critical region for S')\n",
1349
    "\n",
1350
    "pyplot.title('Binomial distribution', fontsize=20)\n",
1351
    "pyplot.legend(fontsize=18, loc='upper left')\n",
1352
    "pyplot.show()"
1353
   ]
1354
  },
1355
  {
1356
   "cell_type": "markdown",
1357
   "id": "29511eef",
1358
   "metadata": {},
1359
   "source": [
1360
    "### p-value для несимметричного распределения\n",
1361
    "\n",
1362
    "Этот критерий &mdash; объединение двух критериев уровня значимости $\\frac{\\alpha}{2}$, для каждого из которых можно посчитать p-value. Обозначим их как $p_1, p_2$. Первый критерий отвергается при $p_1 \\leqslant \\frac{\\alpha}{2}$, второй при $p_2 \\leqslant \\frac{\\alpha}{2}$. А наш объединённый, когда выполнено одно из этих условий, то есть\n",
1363
    "\n",
1364
    "$$ 2p_1 \\leqslant \\alpha \\vee 2p_2 \\leqslant \\alpha \\Leftrightarrow 2 \\cdot \\min(p_1, p_2) \\leqslant \\alpha $$\n",
1365
    "\n",
1366
    "Значит можно считать pvalue как $2  \\min(p_1, p_2)$ и сравнивать с $\\alpha$.\n",
1367
    "\n",
1368
    "Проведём аналогию с симметричным случаем: если сумма оказалась в левой части, то нужно посчитать p-value левого критерия и умножить на 2. Если сумма оказалась в правой части, то нужно посчитать p-value правого критерия и умножить на 2."
1369
   ]
1370
  },
1371
  {
1372
   "cell_type": "code",
1373
   "execution_count": 36,
1374
   "id": "6830ba6b",
1375
   "metadata": {},
1376
   "outputs": [],
1377
   "source": [
1378
    "def pvalue_two_sided(n, q, mu=0.5):\n",
1379
    "    '''Считает pvalue для двусторонней альтернативы в задаче с доставкой\n",
1380
    "    \n",
1381
    "    Параметры:\n",
1382
    "        n: количество доставок в эксперименте\n",
1383
    "        q: количество успешных доставок\n",
1384
    "        mu: вероятность успеха при H0\n",
1385
    "        \n",
1386
    "    Возвращает:\n",
1387
    "        pvalue для двустороннего критерия\n",
1388
    "    '''\n",
1389
    "    binom_h0 = binom(n=n, p=mu)\n",
1390
    "    # считаем для левой части\n",
1391
    "    pvalue_left = binom_h0.cdf(q)\n",
1392
    "    # считаем для правой части\n",
1393
    "    pvalue_right = 1 - binom_h0.cdf(q - 1)\n",
1394
    "    # вычисляем формулу\n",
1395
    "    return 2 * min(pvalue_left, pvalue_right)"
1396
   ]
1397
  },
1398
  {
1399
   "cell_type": "markdown",
1400
   "id": "c268e84a",
1401
   "metadata": {},
1402
   "source": [
1403
    "Посчитаем p-value для $q = 28$"
1404
   ]
1405
  },
1406
  {
1407
   "cell_type": "code",
1408
   "execution_count": 37,
1409
   "id": "5a0f15bf",
1410
   "metadata": {},
1411
   "outputs": [
1412
    {
1413
     "data": {
1414
      "text/plain": [
1415
       "0.08835797030399428"
1416
      ]
1417
     },
1418
     "execution_count": 37,
1419
     "metadata": {},
1420
     "output_type": "execute_result"
1421
    }
1422
   ],
1423
   "source": [
1424
    "pvalue_two_sided(n=30, q=28, mu=0.8)"
1425
   ]
1426
  },
1427
  {
1428
   "cell_type": "markdown",
1429
   "id": "fb6fce41",
1430
   "metadata": {},
1431
   "source": [
1432
    "Видно, что $p-value > 0.05$, значит на уровне значимости $0.05$ даже $28$ успехов недостаточно, чтобы отвергнуть вероятность успеха в $80\\%$."
1433
   ]
1434
  },
1435
  {
1436
   "cell_type": "markdown",
1437
   "id": "09f85389",
1438
   "metadata": {},
1439
   "source": [
1440
    "Заметим, что эта же функция работает и для симметричного случая, возвращая тот же результат"
1441
   ]
1442
  },
1443
  {
1444
   "cell_type": "code",
1445
   "execution_count": 38,
1446
   "id": "65ab23ed",
1447
   "metadata": {},
1448
   "outputs": [
1449
    {
1450
     "data": {
1451
      "text/plain": [
1452
       "0.09873714670538902"
1453
      ]
1454
     },
1455
     "execution_count": 38,
1456
     "metadata": {},
1457
     "output_type": "execute_result"
1458
    }
1459
   ],
1460
   "source": [
1461
    "pvalue_two_sided(n=30, q=20, mu=0.5)"
1462
   ]
1463
  },
1464
  {
1465
   "cell_type": "code",
1466
   "execution_count": 39,
1467
   "id": "9e51f3b8",
1468
   "metadata": {},
1469
   "outputs": [
1470
    {
1471
     "data": {
1472
      "text/plain": [
1473
       "0.09873714670538905"
1474
      ]
1475
     },
1476
     "execution_count": 39,
1477
     "metadata": {},
1478
     "output_type": "execute_result"
1479
    }
1480
   ],
1481
   "source": [
1482
    "pvalue_two_sided_sym(n=30, q=20)"
1483
   ]
1484
  },
1485
  {
1486
   "cell_type": "markdown",
1487
   "id": "059abb3e",
1488
   "metadata": {},
1489
   "source": [
1490
    "### Итог\n",
1491
    "\n",
1492
    "Мы построили функции, которые для выборки из распределения Бернулли позволяют проверить гипотезу $\\mathsf{H}_0: \\mu = M$ для случая правосторонней и двухсторонней альтернатив на любом уровне значимости и размере выборки."
1493
   ]
1494
  }
1495
 ],
1496
 "metadata": {
1497
  "kernelspec": {
1498
   "display_name": "Python 3 (ipykernel)",
1499
   "language": "python",
1500
   "name": "python3"
1501
  },
1502
  "language_info": {
1503
   "codemirror_mode": {
1504
    "name": "ipython",
1505
    "version": 3
1506
   },
1507
   "file_extension": ".py",
1508
   "mimetype": "text/x-python",
1509
   "name": "python",
1510
   "nbconvert_exporter": "python",
1511
   "pygments_lexer": "ipython3",
1512
   "version": "3.7.4"
1513
  },
1514
  "vscode": {
1515
   "interpreter": {
1516
    "hash": "31f2aee4e71d21fbe5cf8b01ff0e069b9275f58929596ceb00d14d90e3e16cd6"
1517
   }
1518
  }
1519
 },
1520
 "nbformat": 4,
1521
 "nbformat_minor": 5
1522
}
1523

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.