applied_statistics

Форк
0
/
Lectures 4-5. T-test.ipynb 
1678 строк · 410.3 Кб
1
{
2
 "cells": [
3
  {
4
   "cell_type": "code",
5
   "execution_count": 2,
6
   "id": "3c410b84",
7
   "metadata": {},
8
   "outputs": [],
9
   "source": [
10
    "from scipy.stats import (\n",
11
    "    norm, binom, expon, t, chi2, pareto, ttest_1samp, ttest_ind, sem\n",
12
    ")\n",
13
    "from statsmodels.stats.api import CompareMeans, DescrStatsW\n",
14
    "from statsmodels.stats.proportion import proportion_confint\n",
15
    "import numpy as numpy\n",
16
    "from seaborn import distplot\n",
17
    "from matplotlib import pyplot\n",
18
    "import seaborn\n",
19
    "\n",
20
    "import sys\n",
21
    "sys.path.append('.')\n",
22
    "\n",
23
    "import warnings\n",
24
    "warnings.filterwarnings(\"ignore\")"
25
   ]
26
  },
27
  {
28
   "cell_type": "code",
29
   "execution_count": 3,
30
   "id": "97a8419a",
31
   "metadata": {},
32
   "outputs": [],
33
   "source": [
34
    "def inverse_plot_colorscheme():\n",
35
    "    import cycler\n",
36
    "    def invert(color_to_convert): \n",
37
    "        table = str.maketrans('0123456789abcdef', 'fedcba9876543210')\n",
38
    "        return '#' + color_to_convert[1:].lower().translate(table).upper()\n",
39
    "    update_dict = {}\n",
40
    "    for key, value in pyplot.rcParams.items():\n",
41
    "        if value == 'black':\n",
42
    "            update_dict[key] = 'white'\n",
43
    "        elif value == 'white':\n",
44
    "            update_dict[key] = 'black'\n",
45
    "    \n",
46
    "    old_cycle = pyplot.rcParams['axes.prop_cycle']\n",
47
    "    new_cycle = []\n",
48
    "    for value in old_cycle:\n",
49
    "        new_cycle.append({\n",
50
    "            'color': invert(value['color'])\n",
51
    "        })\n",
52
    "    pyplot.rcParams.update(update_dict)\n",
53
    "    pyplot.rcParams['axes.prop_cycle'] = cycler.Cycler(new_cycle)\n",
54
    "    lec = pyplot.rcParams['legend.edgecolor']\n",
55
    "    lec = str(1 - float(lec))\n",
56
    "    pyplot.rcParams['legend.edgecolor'] = lec"
57
   ]
58
  },
59
  {
60
   "cell_type": "code",
61
   "execution_count": 4,
62
   "id": "fe03459c",
63
   "metadata": {},
64
   "outputs": [],
65
   "source": [
66
    "inverse_plot_colorscheme()"
67
   ]
68
  },
69
  {
70
   "cell_type": "markdown",
71
   "id": "7ec26d13",
72
   "metadata": {},
73
   "source": [
74
    "# Лекция 4-5. t-test\n",
75
    "\n",
76
    "На этой лекции мы продолжим изучать критерии для анализа средних значений выборок и познакомимся с новым критерием: t-test.\n",
77
    "\n",
78
    "Попробуем решить следующую задачу."
79
   ]
80
  },
81
  {
82
   "cell_type": "markdown",
83
   "id": "c2445408",
84
   "metadata": {},
85
   "source": [
86
    "> 📈 **Задача**\n",
87
    ">\n",
88
    "> В нашей компании хотят перейти с одной СУБД на другую. Главным критерием для перехода является \"затраченное время в сутках на загрузку новых данных\". Если раньше для ежедневного обновления базы требовалось в среднем 10 часов, то хочется найти новую СУБД, в которой все это будет происходить быстрее, чем за 7 часов.\n",
89
    ">\n",
90
    "> Для этого было принято решение перенести все данные на новую тестируемую СУБД. В течение одной недели каждый день мы посчитаем время загрузки данных, и если в среднем на обновление будет уходить меньше 7 часов, то мы полностью перейдем на новую СУБД. Ваша задача придумать, как проверить гипотезу о том, что новая СУБД лучше старой.\n",
91
    "> ___\n",
92
    "> *СУБД - система управления базами данных*\n",
93
    ">\n",
94
    "> *БД - база данных*\n",
95
    "\n",
96
    "Получилась выборка:\n",
97
    "\n",
98
    "- `[6.9, 6.45, 6.32, 6.88, 6.19, 7.13, 6.76]` — время загрузки в новую БД по дням в часах."
99
   ]
100
  },
101
  {
102
   "cell_type": "markdown",
103
   "id": "02e33c7d",
104
   "metadata": {},
105
   "source": [
106
    "Для начала переформулируем условие на языке математики: есть выборка\n",
107
    "- $X_1, X_2, ..., X_7$ — время загрузки в часах новых данных в СУБД за каждый день эксперимента\n",
108
    "- Еще будем считать, что $X$ из нормального распредения."
109
   ]
110
  },
111
  {
112
   "cell_type": "code",
113
   "execution_count": 5,
114
   "id": "0d028b2b",
115
   "metadata": {},
116
   "outputs": [
117
    {
118
     "name": "stdout",
119
     "output_type": "stream",
120
     "text": [
121
      "Среднее время загрузки в СУБД: 6.65\n"
122
     ]
123
    }
124
   ],
125
   "source": [
126
    "X = numpy.array([6.9, 6.45, 6.32, 6.88, 6.09, 7.13, 6.76])\n",
127
    "print(f\"Среднее время загрузки в СУБД: {round(numpy.mean(X), 2)}\")"
128
   ]
129
  },
130
  {
131
   "cell_type": "markdown",
132
   "id": "3c4111ad",
133
   "metadata": {},
134
   "source": [
135
    "Наша гипотеза звучит так:\n",
136
    "\n",
137
    "$H_0$: $E \\overline{X} \\geq 7\\ vs.\\ H_1: E \\overline{X} < 7$\n",
138
    "\n",
139
    "\n",
140
    "\n",
141
    "Кажется, что мы такое уже умеем решать: вспомним про z-критерий.\n",
142
    "\n",
143
    "--- \n",
144
    "**Z-критерий**\n",
145
    "\n",
146
    "$H_0: \\mu \\leq \\mu_0\\ vs.\\ H_1: \\mu > \\mu_0$\n",
147
    "- Статистика $Z(X) = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{\\sigma^2}}$\n",
148
    "- При достаточно большом размере выборки $Z(X) \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$ (по ЦПТ)\n",
149
    "- Односторонний критерий: $\\left\\{Z(X) \\geq z_{1 - \\alpha} \\right\\}$\n",
150
    "    - p-value = $1 - \\Phi(z)$, где z &mdash; реализация статистики $Z(X)$, $\\Phi(z)$ &mdash; функция распределения $\\mathcal{N}(0, 1)$\n",
151
    "- Двусторонний критерий: $\\left\\{Z(X) \\geq z_{1 - \\frac{\\alpha}{2}} \\right\\} \\bigcup \\left\\{Z(X) \\leq -z_{1 - \\frac{\\alpha}{2}} \\right\\} $\n",
152
    "    - p-value = $2\\cdot \\min \\left[{\\Phi(z), 1 - \\Phi(z)} \\right]$, где z &mdash; реализация статистики $Z(X)$\n",
153
    "---\n",
154
    "\n",
155
    "Тогда надо лишь посчитать следующую статистику: $\\sqrt{n}\\dfrac{\\overline X - 7}{\\sqrt{\\sigma^2}} \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$\n",
156
    "\n",
157
    "**Но есть одна проблема: мы не знаем $\\sigma^2$!**\n",
158
    "\n",
159
    "\n",
160
    "Что мы можем сделать? Правильно, попытаемся ее оценить! Благо придумывать оценку не надо, ее уже придумали за нас: $\\widehat{\\sigma^2} =S^2 = \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}}(X_i - \\overline X)^2$. Она является [несмещенной](https://ru.wikipedia.org/wiki/Несмещённая_оценка) и [состоятельной](https://ru.wikipedia.org/wiki/Состоятельная_оценка) оценкой дисперсии."
161
   ]
162
  },
163
  {
164
   "cell_type": "code",
165
   "execution_count": 6,
166
   "id": "fa4b992c",
167
   "metadata": {},
168
   "outputs": [
169
    {
170
     "name": "stdout",
171
     "output_type": "stream",
172
     "text": [
173
      "Оценка sigma^2: 0.1367238095238095\n"
174
     ]
175
    }
176
   ],
177
   "source": [
178
    "# ddof = 1 -- Это значит, что делим не на n, а на n-1 в формуле выше\n",
179
    "print(f\"Оценка sigma^2: {numpy.var(X, ddof=1)}\")"
180
   ]
181
  },
182
  {
183
   "cell_type": "markdown",
184
   "id": "e2590bf7",
185
   "metadata": {},
186
   "source": [
187
    "Давайте введем новый критерий T'-test, в котором мы подставим:\n",
188
    "\n",
189
    "- $T(X) := \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}} $\n",
190
    "- $T(X) \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$\n",
191
    "\n",
192
    "    \n",
193
    "Осталось проверить: **Правда ли что при $H_0$ распределение статистики T &mdash; стандартное нормальное?**\n"
194
   ]
195
  },
196
  {
197
   "cell_type": "markdown",
198
   "id": "c387a0e9",
199
   "metadata": {},
200
   "source": [
201
    "Для этого я предлагаю посмотреть, как на самом деле будет распределена статиcтика $T(X) = \\sqrt{n}\\dfrac{\\overline{X}-\\mu_0}{\\sqrt{S^2}}$ в задаче, поставленной изначально. \n",
202
    "Для этого будем считать, что выборка $X$ состоит из 7 элементов и $X \\sim \\mathcal{N}$.\n",
203
    "\n",
204
    "- Мы $M$ раз нагенерируем выборку $X$ и посчитаем каждый раз статиcтику $T(X)$.\n",
205
    "- В итоге мы получим выборку размера $M$ для $T(X)$ и сможем построить гистограмму распределения. Отдельно построим распределение $\\mathcal{N}(0, 1)$. Если эмпирическое распределение визуально совпадет с теоретическим нормальным, значит все хорошо. А если нет, то так просто мы не можем заменить $\\sigma^2$ на $S^2$.\n",
206
    "    - Дополнительно посмотрим, что будет, если заменить $T(X)$ на $Z(X)$. Благо на искусственном примере мы знаем дисперсию.\n",
207
    "\n",
208
    "Для этого мы напишем единообразную функцию, которая сможет построить распределение для любой статистики, а не только для $T(X), Z(X)$."
209
   ]
210
  },
211
  {
212
   "cell_type": "code",
213
   "execution_count": 7,
214
   "id": "9fe93bed",
215
   "metadata": {},
216
   "outputs": [],
217
   "source": [
218
    "def sample_statistics(number_of_experiments, statistic_function, sample_size, sample_distr):\n",
219
    "    \"\"\"\n",
220
    "        Функция для генерации выборки некой статистики statistic_function, построенной по выборке из распределения sample_distr.\n",
221
    "        Возвращает выборку размера number_of_experiments для statistic_function.\n",
222
    "    \n",
223
    "        Праметры:\n",
224
    "            - number_of_experiments: число экспериментов, в каждом из которых мы посчитаем statistic_function\n",
225
    "            - statistic_function: статистика, которая принимает на вход выборку из распределения sample_distr\n",
226
    "            - sample_size: размер выборки, которая подается на вход statistic_function\n",
227
    "            - sample_distr: распределение изначальной выборки, по которой считается статистика\n",
228
    "    \"\"\"\n",
229
    "\n",
230
    "    statistic_sample = []\n",
231
    "    for _ in range(number_of_experiments):\n",
232
    "        # генерируем number_of_experiments раз выборку\n",
233
    "        sample = sample_distr.rvs(sample_size)\n",
234
    "\n",
235
    "        # считаем статистику\n",
236
    "        statistic = statistic_function(sample)\n",
237
    "\n",
238
    "        #сохраняем\n",
239
    "        statistic_sample.append(statistic)\n",
240
    "    return statistic_sample"
241
   ]
242
  },
243
  {
244
   "cell_type": "code",
245
   "execution_count": 8,
246
   "id": "3edb3f62",
247
   "metadata": {},
248
   "outputs": [
249
    {
250
     "data": {
251
      "image/png": "\n",
252
      "text/plain": [
253
       "<Figure size 1584x360 with 2 Axes>"
254
      ]
255
     },
256
     "metadata": {
257
      "needs_background": "dark"
258
     },
259
     "output_type": "display_data"
260
    }
261
   ],
262
   "source": [
263
    "numpy.random.seed(8)\n",
264
    "\n",
265
    "sample_size=7\n",
266
    "M = 100000\n",
267
    "sample_distr = norm(loc=5, scale=3) # Пусть выборка из этого распределения\n",
268
    "\n",
269
    "T_X = lambda sample: numpy.sqrt(sample_size) * (numpy.mean(sample) - sample_distr.mean()) / numpy.sqrt(numpy.var(sample, ddof=1)) # или numpy.std\n",
270
    "Z_X = lambda sample: numpy.sqrt(sample_size) * (numpy.mean(sample) - sample_distr.mean()) / sample_distr.std()\n",
271
    "samples = {\n",
272
    "    \"T(X)\": sample_statistics(\n",
273
    "    number_of_experiments=M, statistic_function=T_X,\n",
274
    "    sample_size=sample_size, sample_distr=sample_distr),\n",
275
    "    \n",
276
    "    \"Z(X)\": sample_statistics(\n",
277
    "    number_of_experiments=M, statistic_function=Z_X,\n",
278
    "    sample_size=sample_size, sample_distr=sample_distr)\n",
279
    "}\n",
280
    "\n",
281
    "\n",
282
    "pyplot.figure(figsize=(22, 5))\n",
283
    "\n",
284
    "for i, name in enumerate([\"T(X)\", \"Z(X)\"]):\n",
285
    "    pyplot.subplot(1, 2, i + 1)\n",
286
    "    current_sample = samples[name]\n",
287
    "    l_bound, r_bound = numpy.quantile(current_sample, [0.001, 0.999])\n",
288
    "    \n",
289
    "    x = numpy.linspace(l_bound, r_bound, 1000)\n",
290
    "    pyplot.title(f'Распределение статистики {name}, sample size={sample_size}', fontsize=12)\n",
291
    "    distplot(current_sample, label='Эмпирическое распределение')\n",
292
    "    pyplot.plot(x, norm(0, 1).pdf(x), label='$\\mathcal{N}(0, 1)$')\n",
293
    "    pyplot.legend(fontsize=12)\n",
294
    "    pyplot.xlabel(f'{name}', fontsize=12)\n",
295
    "    pyplot.xlim((l_bound, r_bound))\n",
296
    "    pyplot.ylabel('Плотность', fontsize=12)\n",
297
    "    pyplot.grid(linewidth=0.2)\n",
298
    "\n",
299
    "pyplot.show()"
300
   ]
301
  },
302
  {
303
   "cell_type": "markdown",
304
   "id": "dee26223",
305
   "metadata": {},
306
   "source": [
307
    "Мы видим, что:\n",
308
    "- Z-test тут работает: $\\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{\\sigma^2}} \\sim \\mathcal{N}(0, 1)$.\n",
309
    "- Но вот для $T(X)$ это не так! **Они отличаются! А значит T'-критерий не подходит для изначальной задачи!** \n",
310
    "\n",
311
    "----\n",
312
    "\n",
313
    "### Почему такое произошло?"
314
   ]
315
  },
316
  {
317
   "cell_type": "markdown",
318
   "id": "e3d363e9",
319
   "metadata": {},
320
   "source": [
321
    "При создании критерия есть **2 шага**:\n",
322
    "1. Придумать статистику для критерия\n",
323
    "    - С этим мы успешно справились, придумав $T(X)$.\n",
324
    "2. Понять, как распределена статистика.\n",
325
    "    - И вот это самый сложный шаг, который не позволяет использовать любую придуманную статистику. Нужно также понимать ее распределение.\n",
326
    "    - И с этим, как мы увидели, мы провалились для $T(X)$. Нормальное распределение не подошло.\n",
327
    "\n",
328
    "Но почему $T(X) = \\sqrt{n}\\dfrac{\\overline X - \\mu}{\\sqrt{S^2}}$ не распределена нормально, хотя $\\sqrt{n}\\dfrac{\\overline X - \\mu}{\\sqrt{\\sigma^2}} \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$? Почему при замене $\\sigma^2$ на $S^2$ все испортилось? \n",
329
    "\n",
330
    "**Дело в том, что $S^2$ &mdash; это случайная величина!**\n",
331
    "\n",
332
    "Вспомним, как мы выводили Z-критерий?\n",
333
    "1. Мы посчитали, что $\\overline X \\sim \\mathcal{N}(\\mu, \\sigma^2)$. Из ЦПТ или, в случае выше, из свойств нормального распределения.\n",
334
    "2. Далее, все также из свойств этого распределения следует, что если мы вычтем константу или поделим на константу, то нормальное распределение не превратится в другое: поэтому $\\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{\\sigma^2}} \\sim \\mathcal{N}(0, 1)$.\n",
335
    "\n",
336
    "**Но мы ничего не знаем про** $\\dfrac{\\overline{X}}{\\sqrt{\\eta}}$, где $\\overline{X} \\sim \\mathcal{N}, S^2 := \\eta \\sim P$, где P неизвестно. Мы не знаем пока никаких теорем, которые хоть как-то доказывали, что тут также останется нормальное распределение."
337
   ]
338
  },
339
  {
340
   "cell_type": "markdown",
341
   "id": "d7a6046a",
342
   "metadata": {},
343
   "source": [
344
    "Давайте посмотрим на распределение $\\sqrt{S^2}$ на все том же нормальном распределении."
345
   ]
346
  },
347
  {
348
   "cell_type": "code",
349
   "execution_count": 9,
350
   "id": "31f2f191",
351
   "metadata": {},
352
   "outputs": [
353
    {
354
     "data": {
355
      "image/png": "\n",
356
      "text/plain": [
357
       "<Figure size 720x360 with 1 Axes>"
358
      ]
359
     },
360
     "metadata": {
361
      "needs_background": "dark"
362
     },
363
     "output_type": "display_data"
364
    }
365
   ],
366
   "source": [
367
    "numpy.random.seed(42)\n",
368
    "\n",
369
    "\n",
370
    "S2 = lambda sample: numpy.std(sample, ddof=1)\n",
371
    "S2_sample = sample_statistics(\n",
372
    "    number_of_experiments=M, statistic_function=S2,\n",
373
    "    sample_size=sample_size, sample_distr=sample_distr\n",
374
    ")\n",
375
    "\n",
376
    "pyplot.figure(figsize=(10, 5))\n",
377
    "pyplot.title('Распределение $\\sqrt{S^2}$', fontsize=12)\n",
378
    "distplot(S2_sample, label='Эмпирическое распределение')\n",
379
    "pyplot.legend(fontsize=12)\n",
380
    "pyplot.xlabel('$\\sqrt{S^2}$', fontsize=12)\n",
381
    "pyplot.ylabel('Плотность распределения', fontsize=12)\n",
382
    "pyplot.grid(linewidth=0.2)\n",
383
    "pyplot.show()"
384
   ]
385
  },
386
  {
387
   "cell_type": "markdown",
388
   "id": "fd8a8d86",
389
   "metadata": {},
390
   "source": [
391
    "Мы видим, что оно не симметрично и непонятно как распределено. Поэтому, когда мы некую величину из нормального распределения делим на несимметричное непонятное распределение, мы и получаем, что наша статистика $T$ не из нормального распределения.\n",
392
    "\n",
393
    "Так что давайте выведем критерий, который поможет решить изначальную задачу!"
394
   ]
395
  },
396
  {
397
   "cell_type": "markdown",
398
   "id": "550730cf",
399
   "metadata": {
400
    "tags": []
401
   },
402
   "source": [
403
    "## T-test\n",
404
    "\n",
405
    "Давайте решим проблему шага 2 в создании критерия и найдем распределение статистики $T = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}}$. Для того, чтобы это узнать, нам потребуется несколько фактов:\n",
406
    "\n",
407
    "1. Пусть $X_1 \\ldots X_n \\sim \\mathcal{N}(\\mu, \\sigma^2)$\n",
408
    "\n",
409
    "2. Пусть $\\xi_1 \\ldots \\xi_n \\sim \\mathcal{N}(0, 1)$. Тогда $\\eta=\\xi_1^2 +\\ ... +\\xi_n^2 \\sim \\chi^2_n$, &mdash; [**хи-квадрат распределение с $n$ степенями свободы**](https://ru.wikipedia.org/wiki/Распределение_хи-квадрат).\n",
410
    "    - Тогда $\\underset{i=1}{\\overset{n}{\\sum}}\\left(\\xi_i - \\overline \\xi \\right)^2 \\sim \\chi^2_{n-1}$. [Док-во](https://en.wikipedia.org/wiki/Cochran%27s_theorem) для крепких духом, и любящих линейную алгебру.\n",
411
    "\n",
412
    "    - $S^2_X = \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}}(X_i - \\overline X)^2 $\n",
413
    "\n",
414
    "    - $\\xi_i := \\dfrac{X_i - \\mu}{\\sigma} \\sim \\mathcal{N}(0, 1)$. Тогда $S^2_{\\xi} = \\dfrac{1}{\\sigma^2}S^2_X$.\n",
415
    "<!--     $$\\begin{align}\n",
416
    "    S^2_{\\xi} &= \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}}\\left(\\xi_i - \\overline \\xi \\right)^2 =\n",
417
    "            \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}} \\left(\\dfrac{X_i-\\mu}{\\sigma} - \\underset{i=1}{\\overset{n}{\\sum}}\\left[\\dfrac{X_i-\\mu}{n\\sigma}\\right] \\right)^2 = \\\\\n",
418
    "             &= \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}} \\left(\\dfrac{X_i}{\\sigma} - \\dfrac{\\mu}{\\sigma} - \\underset{i=1}{\\overset{n}{\\sum}}\\left[\\dfrac{X_i}{n\\sigma}\\right] + \\dfrac{n\\mu}{n\\sigma} \\right)^2 =\\\\\n",
419
    "             &= \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}} \\left(\\dfrac{X_i}{\\sigma} -\\dfrac{\\overline X_i}{\\sigma} \\right)^2 = \\dfrac{1}{\\sigma \\cdot(n - 1)}\\underset{i=1}{\\overset{n}{\\sum}} \\left(X_i - \\overline X_i \\right)^2 = \\dfrac{1}{\\sigma}S^2_X\n",
420
    "    \\end{align}\n",
421
    "    $$ -->\n",
422
    "    \n",
423
    "    - А значит $\\dfrac{(n - 1)\\cdot S^2_X}{\\sigma^2} = \\underset{i=1}{\\overset{n}{\\sum}}\\left(\\xi_i - \\overline \\xi \\right)^2 \\sim \\chi^2_{n-1}$\n",
424
    "\n",
425
    "3. Пусть $\\xi \\sim \\mathcal{N}(0, 1), \\eta \\sim \\chi^2_k$ и $\\xi$ с $\\eta$ независимы. Тогда статистика $\\zeta = \\dfrac{\\xi}{\\sqrt{\\eta/k}} \\sim t_{k}$ &mdash; из [распределения Стьюдента](https://ru.wikipedia.org/wiki/Распределение_Стьюдента) с k степенями свободы.\n",
426
    " \n",
427
    "    - $\\xi := \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sigma} \\sim \\mathcal{N}(0, 1)$\n",
428
    "    - $\\eta := \\dfrac{(n - 1)\\cdot S^2_X}{\\sigma^2} \\sim \\chi^2_{n-1}$\n",
429
    "    - $\\xi$ и $\\eta$ [независимы](https://math.stackexchange.com/questions/4165803/overlinex-and-s2-are-independent)\n",
430
    "    - Тогда\n",
431
    "    $$\\begin{align}\n",
432
    "        T = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}} = \\frac{\\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sigma}}{\\sqrt{\\dfrac{(n - 1)\\cdot S^2_X}{(n - 1)\\sigma^2}}} = \\dfrac{\\xi}{\\sqrt{\\dfrac{\\eta}{n-1}}} \\sim t_{n - 1}\n",
433
    "    \\end{align}$$\n",
434
    "\n",
435
    "**Итого:**\n",
436
    "\n",
437
    "Придуманная нами статистика $T = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}} \\sim t_{n - 1}$ &mdash; взята из распределения Стьюдента с n - 1 степенью свободы. **Но только в случае, если изначальная выборка из нормального распределения!**\n",
438
    "\n",
439
    "Теперь нам достаточно данных, чтобы построить критерий для нашей изначальной задачи:\n",
440
    "\n",
441
    "### T-test, критерий\n",
442
    "\n",
443
    "$H_0: \\mu =\\mu_0, X \\sim \\mathcal{N}\\ vs.\\ H_1: \\mu > \\mu_0$ или $X$ не из нормального распределения\n",
444
    "- Статистика $T(X) = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}}$\n",
445
    "- $T(X)  \\sim t_{n - 1}$\n",
446
    "- Односторонний критерий: $\\left\\{T(X) \\geq t_{n-1, 1 - \\alpha} \\right\\}$\n",
447
    "    - p-value = $1 - \\tau_{n-1}(z)$, где z &mdash; реализация статистики $T(X)$, $\\tau_{n-1}(z)$ &mdash; функция распределения $t_{n - 1}$\n",
448
    "- Двусторонний критерий: $\\left\\{T(X) \\geq t_{n-1, 1 - \\frac{\\alpha}{2}} \\right\\} \\bigcup \\left\\{T(X) \\leq -t_{n-1, 1 - \\frac{\\alpha}{2}} \\right\\} $\n",
449
    "    - p-value = $2\\cdot \\min \\left[{\\tau_{n-1}(z), 1 - \\tau_{n-1}(z)} \\right]$, где z &mdash; реализация статистики $T(X)$\n",
450
    "---\n",
451
    "\n",
452
    "Давайте теперь протестируем все наши теоретические исследования на практике!\n",
453
    "\n",
454
    "#### Python-библиотеки:\n",
455
    "- `scipy.stats.chi2(df=N)` &mdash; [библиотека](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.chi2.html) для распределения хи-квадрат с N степенями свободы.\n",
456
    "- `scipy.stats.t(df=N)` &mdash; [библиотека](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.t.html) для распределения Стьюдента с N степенями свободы.\n",
457
    "- `scipy.stats.ttest_1samp`  &mdash; [реализованный T-критерий](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_1samp.html) в Python\n",
458
    "\n",
459
    "\n",
460
    "Для начала посмотрим на распределение Хи квадрат и на распределение $\\eta$."
461
   ]
462
  },
463
  {
464
   "cell_type": "code",
465
   "execution_count": 10,
466
   "id": "d29146f0",
467
   "metadata": {},
468
   "outputs": [
469
    {
470
     "data": {
471
      "image/png": "\n",
472
      "text/plain": [
473
       "<Figure size 720x360 with 1 Axes>"
474
      ]
475
     },
476
     "metadata": {
477
      "needs_background": "dark"
478
     },
479
     "output_type": "display_data"
480
    }
481
   ],
482
   "source": [
483
    "numpy.random.seed(42)\n",
484
    "\n",
485
    "\n",
486
    "eta_statistic = lambda sample: numpy.var(sample, ddof=1) * (sample_size - 1) / sample_distr.var()\n",
487
    "eta_sample = sample_statistics(\n",
488
    "    number_of_experiments=M, statistic_function=eta_statistic,\n",
489
    "    sample_size=sample_size, sample_distr=sample_distr\n",
490
    ")\n",
491
    "\n",
492
    "\n",
493
    "chi2_dist = chi2(df=sample_size-1) # Распределение chi2\n",
494
    "\n",
495
    "l_bound, r_bound = numpy.quantile(eta_sample, [0.001, 0.999])\n",
496
    "x = numpy.linspace(l_bound, r_bound, 1000)\n",
497
    "\n",
498
    "pyplot.figure(figsize=(10, 5))\n",
499
    "pyplot.title('Распределение $\\eta$', fontsize=12)\n",
500
    "distplot(eta_sample, label='Эмпирическое распределение')\n",
501
    "pyplot.plot(x, chi2_dist.pdf(x), label='Chi2(n-1)')\n",
502
    "pyplot.legend(fontsize=12)\n",
503
    "pyplot.xlabel('$\\eta$', fontsize=12)\n",
504
    "pyplot.ylabel('Плотность распределения', fontsize=12)\n",
505
    "pyplot.grid(linewidth=0.2)\n",
506
    "pyplot.show()"
507
   ]
508
  },
509
  {
510
   "cell_type": "markdown",
511
   "id": "11db4cc6",
512
   "metadata": {},
513
   "source": [
514
    "Видим, что все совпало!"
515
   ]
516
  },
517
  {
518
   "cell_type": "code",
519
   "execution_count": 10,
520
   "id": "46d91c31",
521
   "metadata": {},
522
   "outputs": [
523
    {
524
     "data": {
525
      "image/png": "\n",
526
      "text/plain": [
527
       "<Figure size 720x360 with 1 Axes>"
528
      ]
529
     },
530
     "metadata": {
531
      "needs_background": "dark"
532
     },
533
     "output_type": "display_data"
534
    }
535
   ],
536
   "source": [
537
    "numpy.random.seed(42)\n",
538
    "\n",
539
    "\n",
540
    "T_X = lambda sample: numpy.sqrt(sample_size) * (numpy.mean(sample) - sample_distr.mean()) / numpy.std(sample, ddof=1)\n",
541
    "T_sample = sample_statistics(\n",
542
    "    number_of_experiments=M, statistic_function=T_X,\n",
543
    "    sample_size=sample_size, sample_distr=sample_distr\n",
544
    ")\n",
545
    "\n",
546
    "\n",
547
    "T_dist = t(df=sample_size-1) # Распределение T Стьюдента\n",
548
    "\n",
549
    "l_bound, r_bound = numpy.quantile(T_sample, [0.001, 0.999])\n",
550
    "x = numpy.linspace(l_bound, r_bound, 1000)\n",
551
    "\n",
552
    "pyplot.figure(figsize=(10, 5))\n",
553
    "pyplot.title('Распределение $T(X)$', fontsize=12)\n",
554
    "distplot(T_sample, color='royalblue', label='Эмпирическое распределение')\n",
555
    "pyplot.plot(x, T_dist.pdf(x), c='green', label='T(n-1)')\n",
556
    "pyplot.plot(x, norm(0, 1).pdf(x), c='yellow', label='$\\mathcal{N}(0, 1)$')\n",
557
    "pyplot.legend(fontsize=12)\n",
558
    "pyplot.xlabel('$T(X)$', fontsize=12)\n",
559
    "pyplot.ylabel('Плотность распределения', fontsize=12)\n",
560
    "pyplot.xlim((l_bound, r_bound))\n",
561
    "pyplot.grid(linewidth=0.2)\n",
562
    "pyplot.show()"
563
   ]
564
  },
565
  {
566
   "cell_type": "markdown",
567
   "id": "47967ecb",
568
   "metadata": {},
569
   "source": [
570
    "Здесь видно, что распределение Стьюдента практически идеально описывает данные, в то время как нормальное распределение более \"центрировано\": площадь в центре больше.\n",
571
    "\n",
572
    "Теперь, как вызвать встроенный t-test в Питоне:\n"
573
   ]
574
  },
575
  {
576
   "cell_type": "code",
577
   "execution_count": 11,
578
   "id": "297ecf1f",
579
   "metadata": {},
580
   "outputs": [
581
    {
582
     "data": {
583
      "text/plain": [
584
       "Ttest_1sampResult(statistic=11.510815172646131, pvalue=2.8759451265260583e-20)"
585
      ]
586
     },
587
     "execution_count": 11,
588
     "metadata": {},
589
     "output_type": "execute_result"
590
    }
591
   ],
592
   "source": [
593
    "# Как вызывать критерий\n",
594
    "ttest_1samp(norm(loc=0, scale=1).rvs(100), popmean=-1, alternative='greater')"
595
   ]
596
  },
597
  {
598
   "cell_type": "markdown",
599
   "id": "6548433d",
600
   "metadata": {},
601
   "source": [
602
    "### Доверительный интервал\n",
603
    "\n",
604
    "Будет приведено 2 метода вывода доверительного интервала.\n",
605
    "\n",
606
    "#### 1 метод\n",
607
    "\n",
608
    "Вспомним определение из второй лекции:\n",
609
    "\n",
610
    "> Пусть есть статистика $Q$ и критерий $\\psi(Q)$ для проверки гипотезы $H_0: \\theta = m$ уровня значимости $\\alpha$.\n",
611
    ">\n",
612
    "> Тогда доверительный интервал для $\\theta$ уровня доверия $1 - \\alpha$: множество таких m, что критерий $\\psi(Q)$ не отвергает для них $H_0$.\n",
613
    "\n",
614
    "\n",
615
    "Пусть $\\mu$ &mdash; истинное среднее выборки. Мы также знаем, что при $H_0: \\sqrt{n}\\dfrac{\\overline X - m}{\\sqrt{S^2}} \\sim t_{n - 1}$."
616
   ]
617
  },
618
  {
619
   "cell_type": "markdown",
620
   "id": "39fb8942",
621
   "metadata": {},
622
   "source": [
623
    "Нас интересуют такие $m$, что:  $\\left\\{-t_{n-1, 1 - \\frac{\\alpha}{2}} < \\sqrt{n}\\dfrac{\\overline X - m}{\\sqrt{S^2}} < t_{n-1, 1 - \\frac{\\alpha}{2}} \\right\\}$, в этом случае критерий не отвергнется.\n",
624
    "\n",
625
    "Распишем, чтобы в центре осталось только $m$: $\\left\\{\\overline X - \\dfrac{t_{n - 1, 1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}} < m < \\overline X + \\dfrac{t_{n - 1, 1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}}\\right\\}$. А значит наш доверительный интервал: $CI_{\\mu} = \\left(\\overline X \\pm \\dfrac{t_{n - 1, 1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}} \\right),$ где $S^2 = \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}}(X_i - \\overline X)^2$."
626
   ]
627
  },
628
  {
629
   "cell_type": "markdown",
630
   "id": "c7dae745",
631
   "metadata": {},
632
   "source": [
633
    "### 2 метод\n",
634
    "\n",
635
    "Докажем через [классическое определение](https://ru.wikipedia.org/wiki/Доверительный_интервал#Определение) доверительного интервала.\n",
636
    "\n",
637
    "> Доверительным интервалом для параметра $\\theta$ уровня доверия $1 - \\alpha$ является пара статистик $L(X), R(X)$, таких, что $P(L(X) < \\theta < R(X)) = 1 - \\alpha$.\n",
638
    "\n",
639
    "$$\\begin{align}\n",
640
    "    &T(X) = \\sqrt{n}\\dfrac{\\overline X - \\mu}{\\sqrt{S^2}} \\sim t_{n - 1} \\Rightarrow \\\\\n",
641
    "    &P\\left(-t_{n - 1, 1-\\alpha/2} < \\sqrt{n}\\dfrac{\\overline X - \\mu}{\\sqrt{S^2}} < t_{n - 1, 1-\\alpha/2} \\right) = 1 - \\alpha \\Leftrightarrow \\\\\n",
642
    "    &P\\left(\\overline X - \\dfrac{t_{n - 1, 1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}}  < \\mu < \\overline X + \\dfrac{t_{n - 1, 1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}} \\right) = 1 - \\alpha\n",
643
    "\\end{align}\n",
644
    "$$\n",
645
    "\n",
646
    "\n",
647
    "А значит $CI_{\\mu} = \\left(\\overline X \\pm \\dfrac{t_{n - 1, 1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}} \\right)$. \n",
648
    "\n",
649
    "*Как вы видите, доказательства в обоих случаях практически идентичны.*\n",
650
    "\n",
651
    "\n",
652
    "В Питоне для построения есть специальная функция:"
653
   ]
654
  },
655
  {
656
   "cell_type": "code",
657
   "execution_count": 12,
658
   "id": "e990d35e",
659
   "metadata": {},
660
   "outputs": [
661
    {
662
     "name": "stdout",
663
     "output_type": "stream",
664
     "text": [
665
      "CI = [9.62, 10.39]\n"
666
     ]
667
    }
668
   ],
669
   "source": [
670
    "sample = norm(loc=10, scale=2).rvs(100)\n",
671
    "\n",
672
    "# sem -- standart error of the mean, sem = sqrt(S^2)/sqrt(n)\n",
673
    "left_bound, right_bound = t.interval(alpha=0.95, loc=numpy.mean(sample), df=len(sample)-1, scale=sem(sample)) \n",
674
    "print(f\"CI = [{round(left_bound, 2)}, {round(right_bound, 2)}]\")"
675
   ]
676
  },
677
  {
678
   "cell_type": "markdown",
679
   "id": "e205c68d",
680
   "metadata": {},
681
   "source": [
682
    "-----\n",
683
    "\n",
684
    "Вернемся к изначальной задаче. \n",
685
    "> 📈 **Задача**\n",
686
    ">\n",
687
    "> В нашей компании хотят перейти с одной СУБД на другую. Главным критерием для переходя является \"затраченное время в сутках на загрузку новых данных\". Если раньше для ежедневного обновления базы требовалось в среднем 10 часов, то хочется найти новую СУБД, в которой все это будет происходить бывстрее, чем за 7 часов.\n",
688
    ">\n",
689
    "> Для этого было принято решение перенести все данные на новую тестируемую СУБД. В течение одной недели каждый день мы посчитаем время загрузки данных, и если в среднем на обновление будет уходить меньше 7 часов, то мы полностью перейдем на новую СУБД. Ваша задача придумать, как проверить гипотезу о том, что новая СУБД лучше старой.\n",
690
    "\n",
691
    "Получилась выборка:\n",
692
    "\n",
693
    "- `[6.9, 6.45, 6.32, 6.88, 6.19, 7.13, 6.76]` &mdash; время загрузки в новую БД по дням в часах.\n",
694
    "\n",
695
    "Для начала переформулируем условие на языке математики: есть выборка\n",
696
    "- $X_1, X_2, ..., X_7$ &mdash; время загрузки в часах новых данных в СУБД за каждый день эксперимента\n",
697
    "- Еще будем считать, что $X$ из нормального распредения.\n",
698
    "\n",
699
    "$H_0$: $E \\overline{X} \\geq 7\\ vs.\\ H_1: E \\overline{X} < 7$\n",
700
    "\n",
701
    "\n",
702
    "\n",
703
    "Мы уже знаем, что если выборка нормальна, то мы можем использовать T-test. Тогда\n",
704
    "\n"
705
   ]
706
  },
707
  {
708
   "cell_type": "code",
709
   "execution_count": 13,
710
   "id": "816b21e9",
711
   "metadata": {},
712
   "outputs": [],
713
   "source": [
714
    "X = numpy.array([6.9, 6.45, 6.32, 6.88, 6.09, 7.13, 6.76])"
715
   ]
716
  },
717
  {
718
   "cell_type": "code",
719
   "execution_count": 14,
720
   "id": "0cd29efb",
721
   "metadata": {},
722
   "outputs": [
723
    {
724
     "data": {
725
      "text/plain": [
726
       "Ttest_1sampResult(statistic=-2.5247934680450737, pvalue=0.022497429172957096)"
727
      ]
728
     },
729
     "execution_count": 14,
730
     "metadata": {},
731
     "output_type": "execute_result"
732
    }
733
   ],
734
   "source": [
735
    "ttest_1samp(X, popmean=7, alternative='less')"
736
   ]
737
  },
738
  {
739
   "cell_type": "markdown",
740
   "id": "88027db2",
741
   "metadata": {},
742
   "source": [
743
    "Мы видим, что на уровне значимости 2.5% критерий отвергся, а значит переход на новую СУБД удовлетворяет условиям: загрузка быстрее 7 часов!\n",
744
    "Построим теперь доверительный интервал, чтобы понять, в каких границах у нас будет эффект."
745
   ]
746
  },
747
  {
748
   "cell_type": "code",
749
   "execution_count": 15,
750
   "id": "f42ec21c",
751
   "metadata": {},
752
   "outputs": [
753
    {
754
     "name": "stdout",
755
     "output_type": "stream",
756
     "text": [
757
      "CI = [6.31, 6.99]\n"
758
     ]
759
    }
760
   ],
761
   "source": [
762
    "left_bound, right_bound = t.interval(alpha=0.95, loc=numpy.mean(X), df=len(X)-1, scale=sem(X)) \n",
763
    "print(f\"CI = [{round(left_bound, 2)}, {round(right_bound, 2)}]\")"
764
   ]
765
  },
766
  {
767
   "cell_type": "markdown",
768
   "id": "d0bccc8a",
769
   "metadata": {},
770
   "source": [
771
    "Отлично! В среднем загрузка будет от 6 до 7 часов.\n",
772
    "\n",
773
    "----"
774
   ]
775
  },
776
  {
777
   "cell_type": "markdown",
778
   "id": "86148c3b",
779
   "metadata": {},
780
   "source": [
781
    "Так, мы научились решать задачу оценки среднего выборки, когда дисперсия неизвестна, но выборка из нормального распределения. Теперь научимся решать следующую задачу:\n",
782
    "\n",
783
    "\n",
784
    "> 📈 **Задача**\n",
785
    ">\n",
786
    "> Вы придумали идею для стартапа в Москве, где курьеры собирают заказы для клиентов и отвозят им на дом. Маржа от заказа в вашем стартапе &mdash; X ₽, а стоимость работы курьера &mdash; 1К ₽.\n",
787
    "Специфика вашего стартапа такова, что есть большой риск возврата без оплаты. С учетом стоимостей, инвесторы готовы проспонсировать вам инфраструктуру и привлечение клиентов, если вы покажете, что у вас будет прибыль.\n",
788
    ">\n",
789
    "> Из данных у вас есть принесенные деньги от каждого пользователя. Иногда положительная величина, иногда отрицательная.\n",
790
    "\n",
791
    "Переформулируем задачу на языке статистики:\n",
792
    "- $X_1, X_2, ..., X_N$ &mdash; выборка прибыли от пользователя.\n",
793
    "\n",
794
    "$H_0$: $E \\overline{X} \\leq 0\\ vs.\\ H_1: E \\overline{X} > 0$\n",
795
    "\n",
796
    "Посмотрим на данные:"
797
   ]
798
  },
799
  {
800
   "cell_type": "code",
801
   "execution_count": 16,
802
   "id": "0ebeece4",
803
   "metadata": {},
804
   "outputs": [
805
    {
806
     "name": "stdout",
807
     "output_type": "stream",
808
     "text": [
809
      "[-718.  657.  693.  391. -644.  421.  265. -108. 1956. -684. -753. -725.\n",
810
      " -341. -796. -662.  257. -719. 5184. -739. -291. -427.  283.   10.  500.\n",
811
      " -713. -458.   60. -756.  333. -537. -744.  254. -555. -780. -329. -560.\n",
812
      "  936. -742. -784.  213.  299. -678. -736.   24.  264.  293. -490. 2667.\n",
813
      " -605. -799. -797. -743.  347. -718. -508. -766. 1395.  392.  -62. -510.\n",
814
      "  237. -785. -745. -781. 3232. -727.  204. 2987.  244. -757.  -78.   10.\n",
815
      "  364.   -7. -440.  520.  203.  282.  685.  589. -724.  -48.  263. -457.\n",
816
      " -796. -708. -798.  488. -677. -690.  786. -770.  659. -679. -309. -731.\n",
817
      "  288. 1047. -796. -721.]\n"
818
     ]
819
    }
820
   ],
821
   "source": [
822
    "profits = numpy.loadtxt('profit_from_user.out', delimiter=',')\n",
823
    "print(profits[:100])"
824
   ]
825
  },
826
  {
827
   "cell_type": "code",
828
   "execution_count": 17,
829
   "id": "98c403a0",
830
   "metadata": {},
831
   "outputs": [
832
    {
833
     "name": "stdout",
834
     "output_type": "stream",
835
     "text": [
836
      "average profit = 58.4868\n",
837
      "n = 5000\n"
838
     ]
839
    }
840
   ],
841
   "source": [
842
    "print(f\"average profit = {profits.mean()}\")\n",
843
    "print(f\"n = {profits.shape[0]}\")"
844
   ]
845
  },
846
  {
847
   "cell_type": "code",
848
   "execution_count": 18,
849
   "id": "3f3a67b3",
850
   "metadata": {},
851
   "outputs": [
852
    {
853
     "data": {
854
      "image/png": "\n",
855
      "text/plain": [
856
       "<Figure size 432x288 with 1 Axes>"
857
      ]
858
     },
859
     "metadata": {
860
      "needs_background": "dark"
861
     },
862
     "output_type": "display_data"
863
    }
864
   ],
865
   "source": [
866
    "seaborn.distplot(profits)\n",
867
    "pyplot.grid(linewidth=0.2)"
868
   ]
869
  },
870
  {
871
   "cell_type": "markdown",
872
   "id": "3cdc18c7",
873
   "metadata": {},
874
   "source": [
875
    "\n",
876
    "В отличие от предыдущей задачи тут 2 отличия:\n",
877
    "- Изначальная выборка не из нормального распределения\n",
878
    "- Выборка достаточно крупная: не 7 элементов, а уже 5000.\n",
879
    "\n",
880
    "Так, а что мы уже умеем решать?\n",
881
    "\n",
882
    "\n",
883
    "|                          | маленькая выборка | большая выборка |\n",
884
    "|--------------------------|-------------------|-----------------|\n",
885
    "| нормальное распределение | t-test            | t-test          |\n",
886
    "| любое распределение      |                   |                 |\n",
887
    "\n",
888
    "А сейчас мы выведем критерий для ячейки: \"любое распределение, большая выборка\". Мы снова будем выводить распределение для $T(X)$ статистики.\n",
889
    "\n",
890
    "\n",
891
    "## T'-test\n",
892
    "\n",
893
    "Вспомним, что у нас изначально была идея в Z-тесте вместо статистики Z, в которой дисперсия известна, использовать критерий T, где дисперсия оценена на данных. И использовать нормальное распределение. Только в первой задаче этот критерий нам не помог. Но что, если бы выборка была большой? Могли бы мы использовать нормальное распределение для приближения?\n",
894
    "\n",
895
    "\n",
896
    "1. Будем рассматривать ту же статистику $T = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}}$\n",
897
    "2. $\\xi := \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{\\sigma^2}} \\stackrel{d}{\\rightarrow} \\mathcal{N}(0, 1)$. По ЦПТ сходимость есть только по [распределению](https://en.wikipedia.org/wiki/Convergence_in_distribution).\n",
898
    "3. Тогда $T = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}} = \\xi \\cdot \\sqrt{\\dfrac{\\sigma^2}{S^2}}$. Обозначим $\\phi := \\sqrt{\\dfrac{\\sigma^2}{S^2}}$\n",
899
    "    - Помните, в начале лекции было сказано, что $S^2$ &mdash; лучшая оценка для дисперсии? Все дело в том, что она является [состоятельной оценкой](https://ru.wikipedia.org/wiki/Состоятельная_оценка) $\\sigma^2$. По-другому это можно записать так: $S^2$ [сходится по вероятности](https://en.wikipedia.org/wiki/Convergence_of_random_variables#Convergence_in_probability) к $\\sigma^2$. То есть $S^2  \\stackrel{p}{\\rightarrow} \\sigma^2$ \n",
900
    "    - А в этом случае существует [теорема](https://en.wikipedia.org/wiki/Continuous_mapping_theorem), утверждающая, что $\\phi = \\dfrac{\\sigma^2}{S^2}  \\stackrel{p}{\\rightarrow} 1$.\n",
901
    "4. $T = \\xi \\cdot \\phi$.\n",
902
    "    - $\\xi \\stackrel{d}{\\rightarrow} \\mathcal{N}(0, 1)$\n",
903
    "    - $\\phi  \\stackrel{p}{\\rightarrow} 1$\n",
904
    "    - И тут вступает в силу еще одна [теорема](https://en.wikipedia.org/wiki/Slutsky%27s_theorem): $T = \\xi \\cdot \\phi \\stackrel{d}{\\rightarrow} 1\\cdot \\mathcal{N}(0, 1)$. Та же сходимость, что и в ЦПТ!\n",
905
    "    - **То есть статистика $T$ точно также нормально распределена!**\n",
906
    "    \n",
907
    "    \n",
908
    "Итого, если выборка большая, то мы можем считать, что $T(X) \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$.\n",
909
    "\n",
910
    "---\n",
911
    "\n",
912
    "Заметим, что в случае \"нормальное распределение, большая выборка\" работают сразу 2 критерия: t-test и t'-test. Это значит, что если $T(X) \\overset{H_0}{\\sim} t_{n - 1}$ и $T(X) \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$, то $t_{n - 1} \\approx \\mathcal{N}(0, 1)$.\n",
913
    "- Формально же, если степень свободы в t-распределении равна бесконечности, то это нормальное распределение! $\\lim_{n\\rightarrow \\infty}t_{n} = \\mathcal{N}(0, 1)$\n",
914
    "\n",
915
    "А если $t_{n - 1} \\approx \\mathcal{N}(0, 1)$, то мы вместо T'-критерия мы можем использовать T-критерий! **Из того, что мы теоретически можем использовать T'-test, на практике мы можем использовать и T-test!**\n",
916
    "\n",
917
    "---\n",
918
    "\n",
919
    "А значит мы заполнили еще 1 ячейку в таблице:\n",
920
    "\n",
921
    "|                          | маленькая выборка | большая выборка |\n",
922
    "|--------------------------|-------------------|-----------------|\n",
923
    "| нормальное распределение | t-test            | t-test, t'-test |\n",
924
    "| любое распределение      |                   | t'-test, t-test |\n",
925
    "\n",
926
    "\n",
927
    "### T'-test, критерий\n",
928
    "\n",
929
    "$H_0: \\mu =\\mu_0\\ vs.\\ H_1: \\mu > \\mu_0$\n",
930
    "- Статистика $T(X) = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}}$\n",
931
    "- При достаточно большом размере выборки $T(X) \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$ (по ЦПТ и куче вспомогательных теорем)\n",
932
    "- Односторонний критерий: $\\left\\{T(X) \\geq z_{1 - \\alpha} \\right\\}$\n",
933
    "    - p-value = $1 - \\Phi(z)$, где z &mdash; реализация статистики $T(X)$, $\\Phi(z)$ &mdash; функция распределения $\\mathcal{N}(0, 1)$\n",
934
    "- Двусторонний критерий: $\\left\\{T(X) \\geq z_{1 - \\frac{\\alpha}{2}} \\right\\} \\bigcup \\left\\{T(X) \\leq -z_{1 - \\frac{\\alpha}{2}} \\right\\} $\n",
935
    "    - p-value = $2\\cdot \\min \\left[{\\Phi(z), 1 - \\Phi(z)} \\right]$, где z &mdash; реализация статистики $Z(X)$\n",
936
    "---\n",
937
    "\n",
938
    "\n",
939
    "Проверим наш критерий на крупных выборках:"
940
   ]
941
  },
942
  {
943
   "cell_type": "code",
944
   "execution_count": 19,
945
   "id": "1d899d69",
946
   "metadata": {},
947
   "outputs": [
948
    {
949
     "data": {
950
      "image/png": "\n",
951
      "text/plain": [
952
       "<Figure size 720x360 with 1 Axes>"
953
      ]
954
     },
955
     "metadata": {
956
      "needs_background": "dark"
957
     },
958
     "output_type": "display_data"
959
    }
960
   ],
961
   "source": [
962
    "numpy.random.seed(8)\n",
963
    "\n",
964
    "sample_size=2000\n",
965
    "M = 10000\n",
966
    "sample_distr = expon(loc=5, scale=300)\n",
967
    "\n",
968
    "T_X = lambda sample: numpy.sqrt(sample_size) * (numpy.mean(sample) - sample_distr.mean()) / numpy.std(sample, ddof=1)\n",
969
    "T_sample = sample_statistics(\n",
970
    "    number_of_experiments=M, statistic_function=T_X,\n",
971
    "    sample_size=sample_size, sample_distr=sample_distr)\n",
972
    "\n",
973
    "pyplot.figure(figsize=(10, 5))\n",
974
    "l_bound, r_bound = numpy.quantile(T_sample, [0.001, 0.999])\n",
975
    "\n",
976
    "\n",
977
    "x = numpy.linspace(l_bound, r_bound, 1000)\n",
978
    "pyplot.title(f'Распределение статистики T(X), sample size={sample_size}', fontsize=12)\n",
979
    "distplot(T_sample, label='Эмпирическое распределение')\n",
980
    "pyplot.plot(x, norm(0, 1).pdf(x), label='Экспоненциальное распределение')\n",
981
    "pyplot.legend(fontsize=12)\n",
982
    "pyplot.xlabel(f'{name}', fontsize=12)\n",
983
    "pyplot.xlim((l_bound, r_bound))\n",
984
    "pyplot.ylabel('Плотность', fontsize=12)\n",
985
    "pyplot.grid(linewidth=0.2)\n",
986
    "pyplot.show()"
987
   ]
988
  },
989
  {
990
   "cell_type": "markdown",
991
   "id": "1ff0f842",
992
   "metadata": {},
993
   "source": [
994
    "Мы видим, что распределения совпали! А на нормальном распределении, где в первый раз были различия на маленькой выборке?"
995
   ]
996
  },
997
  {
998
   "cell_type": "code",
999
   "execution_count": 20,
1000
   "id": "5afd1ae3",
1001
   "metadata": {},
1002
   "outputs": [
1003
    {
1004
     "data": {
1005
      "image/png": "\n",
1006
      "text/plain": [
1007
       "<Figure size 720x360 with 1 Axes>"
1008
      ]
1009
     },
1010
     "metadata": {
1011
      "needs_background": "dark"
1012
     },
1013
     "output_type": "display_data"
1014
    }
1015
   ],
1016
   "source": [
1017
    "numpy.random.seed(8)\n",
1018
    "\n",
1019
    "sample_size=2000\n",
1020
    "M = 30000\n",
1021
    "sample_distr = norm(loc=5, scale=300)\n",
1022
    "\n",
1023
    "T_X = lambda sample: numpy.sqrt(sample_size) * (numpy.mean(sample) - sample_distr.mean()) / numpy.std(sample, ddof=1)\n",
1024
    "T_sample = sample_statistics(\n",
1025
    "    number_of_experiments=M, statistic_function=T_X,\n",
1026
    "    sample_size=sample_size, sample_distr=sample_distr)\n",
1027
    "\n",
1028
    "pyplot.figure(figsize=(10, 5))\n",
1029
    "l_bound, r_bound = numpy.quantile(T_sample, [0.001, 0.999])\n",
1030
    "\n",
1031
    "\n",
1032
    "x = numpy.linspace(l_bound, r_bound, 1000)\n",
1033
    "pyplot.title(f'Распределение статистики T(X), sample size={sample_size}', fontsize=12)\n",
1034
    "distplot(T_sample, label='Эмпирическое распределение')\n",
1035
    "pyplot.plot(x, norm(0, 1).pdf(x), label='$\\mathcal{N}(0, 1)$')\n",
1036
    "pyplot.legend(fontsize=12)\n",
1037
    "pyplot.xlabel(f'{name}', fontsize=12)\n",
1038
    "pyplot.xlim((l_bound, r_bound))\n",
1039
    "pyplot.ylabel('Плотность', fontsize=12)\n",
1040
    "pyplot.grid(linewidth=0.2)\n",
1041
    "pyplot.show()"
1042
   ]
1043
  },
1044
  {
1045
   "cell_type": "markdown",
1046
   "id": "2ca265ad",
1047
   "metadata": {},
1048
   "source": [
1049
    "Тоже самое: статистика из нормального распределения! То есть в первый раз нам не повезло, что размер выборки был маленьким("
1050
   ]
1051
  },
1052
  {
1053
   "cell_type": "markdown",
1054
   "id": "558ef7eb",
1055
   "metadata": {},
1056
   "source": [
1057
    "### Доверительный интервал\n",
1058
    "\n",
1059
    "Выводится также, как и у t-test:\n",
1060
    "\n",
1061
    "$CI_{\\mu} = \\left(\\overline X \\pm \\dfrac{z_{1 - \\alpha/2} \\sqrt{S^2}}{\\sqrt{n}} \\right)$.\n"
1062
   ]
1063
  },
1064
  {
1065
   "cell_type": "code",
1066
   "execution_count": 21,
1067
   "id": "221b663a",
1068
   "metadata": {},
1069
   "outputs": [
1070
    {
1071
     "name": "stdout",
1072
     "output_type": "stream",
1073
     "text": [
1074
      "CI = [289.96, 316.15]\n"
1075
     ]
1076
    }
1077
   ],
1078
   "source": [
1079
    "sample = expon(scale=300).rvs(2000) # E sample = scale = 300\n",
1080
    "left_bound, right_bound = norm.interval(alpha=0.95, loc=numpy.mean(sample), scale=sem(sample)) \n",
1081
    "print(f\"CI = [{round(left_bound, 2)}, {round(right_bound, 2)}]\")"
1082
   ]
1083
  },
1084
  {
1085
   "cell_type": "markdown",
1086
   "id": "d987490b",
1087
   "metadata": {},
1088
   "source": [
1089
    "----"
1090
   ]
1091
  },
1092
  {
1093
   "cell_type": "markdown",
1094
   "id": "999af83b",
1095
   "metadata": {},
1096
   "source": [
1097
    "Ну вот теперь кажется же самое время решать исходную задачу!"
1098
   ]
1099
  },
1100
  {
1101
   "cell_type": "code",
1102
   "execution_count": 22,
1103
   "id": "7bc5a8a8",
1104
   "metadata": {},
1105
   "outputs": [
1106
    {
1107
     "name": "stdout",
1108
     "output_type": "stream",
1109
     "text": [
1110
      "CI = [14.04, 102.94]\n"
1111
     ]
1112
    }
1113
   ],
1114
   "source": [
1115
    "left_bound, right_bound = norm.interval(alpha=0.95, loc=numpy.mean(profits), scale=sem(profits)) \n",
1116
    "print(f\"CI = [{round(left_bound, 2)}, {round(right_bound, 2)}]\")"
1117
   ]
1118
  },
1119
  {
1120
   "cell_type": "markdown",
1121
   "id": "e5925afa",
1122
   "metadata": {},
1123
   "source": [
1124
    "Да, выручка положительна! Значит мы нашли инвесторов для нашего стартапа :)\n",
1125
    "\n",
1126
    "Единственное но: **а правда ли, что наша выборка достаточно большая? И T'-test тут работает?** Ответ на этот вопрос мы получим на следующем занятии."
1127
   ]
1128
  },
1129
  {
1130
   "cell_type": "markdown",
1131
   "id": "bfb58f24",
1132
   "metadata": {},
1133
   "source": [
1134
    "## Какой критерий в итоге использовать на практике? T-test или T'-test?"
1135
   ]
1136
  },
1137
  {
1138
   "cell_type": "markdown",
1139
   "id": "69c86b7e",
1140
   "metadata": {},
1141
   "source": [
1142
    "Для начала определимся, когда какой критерий лучше использовать?\n",
1143
    "\n",
1144
    "1. Если выборка размера 60, то уже $t_{59} \\approx \\mathcal{N}(0, 1)$. \n",
1145
    "    - Посмотрим на распределения Стьюдента и нормального:"
1146
   ]
1147
  },
1148
  {
1149
   "cell_type": "code",
1150
   "execution_count": 23,
1151
   "id": "e10cd6fc",
1152
   "metadata": {},
1153
   "outputs": [
1154
    {
1155
     "data": {
1156
      "image/png": "\n",
1157
      "text/plain": [
1158
       "<Figure size 720x360 with 1 Axes>"
1159
      ]
1160
     },
1161
     "metadata": {
1162
      "needs_background": "dark"
1163
     },
1164
     "output_type": "display_data"
1165
    }
1166
   ],
1167
   "source": [
1168
    "df = 59\n",
1169
    "t_dist = t(df=df)\n",
1170
    "z_dist = norm(loc=0, scale=1)\n",
1171
    "\n",
1172
    "x = numpy.linspace(-3, 3, 100)\n",
1173
    "pyplot.figure(figsize=(10, 5))\n",
1174
    "pyplot.title(f'Плотность распределения статистики T и N', fontsize=12)\n",
1175
    "pyplot.plot(x, z_dist.pdf(x), label='N(0, 1)')\n",
1176
    "pyplot.plot(x, t_dist.pdf(x), label=f't(df={df})')\n",
1177
    "pyplot.legend(fontsize=12)\n",
1178
    "pyplot.grid(linewidth=0.2)\n",
1179
    "pyplot.show()"
1180
   ]
1181
  },
1182
  {
1183
   "cell_type": "markdown",
1184
   "id": "26541440",
1185
   "metadata": {},
1186
   "source": [
1187
    "- Мы видим, что эти 2 распределения визуально полностью совпадают, поэтому неважно, как посчитать: статистика $T\\sim \\mathcal{N}(0, 1)$ или $T\\sim t_n$.\n",
1188
    "- **Но это не значит, что с N=60 T-test/T'-test работают корректно!** Если выборка не из нормального рапределения, они оба могут все еще ошибаться.\n",
1189
    "\n",
1190
    "2. Если выборка меньше 60, то безопасней использовать t-test, нежели t'-test.\n",
1191
    "    - **У T-test FPR всегда будет меньше, чем у T'-test**. \n",
1192
    "        - На FPR влияет процент случаев `pvalue < alpha`. У t-test pvalue $\\geq$ t'-test pvalue.\n",
1193
    "        - `pvalue = t_distr.cdf(x)` или `pvalue = norm_dist.cdf(x)`. Поэтому, чем тяжелее хвост у распределения, тем больше p-value. А теперь посмотрим на примере:"
1194
   ]
1195
  },
1196
  {
1197
   "cell_type": "code",
1198
   "execution_count": 24,
1199
   "id": "bca474df",
1200
   "metadata": {},
1201
   "outputs": [
1202
    {
1203
     "data": {
1204
      "image/png": "iVBORw0KGgoAAAANSUhEUgAAAlMAAAFQCAYAAACbPfvbAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAgAElEQVR4nOzdeVyU1f7A8c/MAMM2LLIpq4Ka4q5p5UZlq5V2b2VdLW/96qaV7ZbaoubtZtpum0uKmktatllapuKamqaiKRgIsossAwwM2wzP748HR1BQkFFQv+/X67xm5jnPc86ZA8m3c85zHo2iKAghhBBCiPOjbe4GCCGEEEJcyiSYEkIIIYRoAgmmhBBCCCGaQIIpIYQQQogmkGBKCCGEEKIJJJgSQgghhGgCCaaEEOLiGgp0AZyBcc3cFiGEHUgwJUTLNBLYAxQDWcBaYGB13lSgEjBVp7+BT4A2Na6/Hqiqvv5kWn3hmy0aoAj4HkgHAs9yXs2fXRVQWuPzKDu04xhwAnCrcewxYJMdyhbiiiLBlBAtzwvAh8BbQAAQCnwGDK9xzgrAALQC/gG0Bv6kdkCVCbjXSHdd6IaLBtkGdAB8gVfOcl7Nn10q6s/v5OeldmqLDnjWTmUJccWSYEqIlsUTmAY8BXwLlKCOQq0GXqrj/ErgEHA/kAO8eB51LgRmA7+hjnRtBsJq5H8EpKGOqPwJDKqRp0MNCI5WX/snEFKdp1S3/+RoSkV1XQBtq/MfRw36soDxNcrVAhOry80DVqIGjjWlc2q0pgJYUiMvEFiF2ifJwDOnXfswYK3RNgVoX53nCcyvblMG8Gb19zx53bY62nF99fupp7Xjs9PKXlhd3klrqvMdaLrzKfsd1H73skP9QlyxJJgSomW5DnUtzXeNvM4K/EDtQKcxRgH/RR0t2U/tkY/dQE/UYGYZ8HV1G0EdRfsX6jogD+D/AHONa3twajRlZh313oA6SnMLMAG4qfr408DdQBRqYGQEPj3tWg1wW3XZb9U4rkUNPmOBIGAI8Bxw62nn/F6jbTUtBCyoAVCv6rY9Vkfbz6UjcPtZ8m8Aup9HuQ3R0LL3oE7rjT/HeUKIs5BgSoiWxQfIRf1j3liZ1B69CQQKaqQRZ7n2Z2ALUA68ihrUnRxhWoI6OmQB3gP0wFXVeY8BrwFHUEdBYqvPbag3UEevDgLRqIEZwNjqdqRXt2kqcC+1R1lcUEekTtcX8EMd4asAkoB5wAM1znGq59oA1MDwuep2nQA+OO3ahnoLNUCtiwY1uJx8HuWeS2PLnowavPpdgLYIcUWwx9CyEMJ+8lBHhxxofEAVBOTX+JwJBDfw2rQa74urywmsPj4eeLT6s4I6AuVbfW4I6lTc+apZbwrQrfp9GOroXFWNfCtqsJOBGtB5oU7jnS6MU4HkSTpga43PrVBHu+q61hF1iu8k7WntvPa0sj3qKOda1IDzftQpw9ONQA2aN9aR11SNLfsv4CfUadW4C9AeIS57EkwJ0bLsQB2JuRv4phHXaVEXKK8/z3pDarx3Rw02MlGnDV9GnSo7hBrcGFFHP0ANMiJQ/yCfb73x1e9Dq+s8We7/Advrua4n6hqt5Dry0qqPdzhLvR1R74Ks69py1GCxvmB2J6furAR19Ox0M4FJqAHg6RxRR6zuPUv7ztf5lj0F2Is68iiEaCSZ5hOiZSlEnXb5FDWgckX9A3k7da85cgA6A8tR7+h7/zzrHYoaIDih/jHeiRpYGFCDipzquiZTeyTmi+rzO6AGWN1Rpyob6nXU79gFeAT1LkVQF8T/j1ML4f04dTejFnVa6mvqDlb+QA20JqBOBeqArqjTfwADUPv2+zquzQLWoQYVHtV1RaCu3WqoG1GDzp/qyX8Idb3WgUaU2VDnW3Yiat+fvlBfCNEAEkwJ0fK8h7qw+zXUICYNdXPHmn/870edjisEfkSdHuzDqZGdxlqGOjqRX13Og9XHfwV+QR3FSQHKqD3l9T7qnXbrUO/2m48awDTUZtQ/5BuAd6vLAfUOwh+rP5tQg7trqvNmoy6Yf5BTd+O9gtono1ADrDtRR6+SUae8vkC9Sy8SWIQ6dflHPW0ajRpUHkYdhfuG2ltOnEsb1NG8+nijBpEXQlPKnkbtPaeEEA2kURSludsghGheC1Gnql67iHW2RQ10HGn82rCF1WnTaccfRB09W9iUhgkhRGPJmikhxKUmH3Vd0+lKkH/ThBDNQP7hEUJcal6o53hj9+YSQgi7kGk+IYQQQogmkAXoQgghhBBNIMGUEEIIIUQTNNuaqZycHCUlJeWCla/Tqc8ltVrr2oZGnA/pU/uTPrUv6U/7kz61L+lP+7tYfXr11VfnUs9jl5otmEpJSaFv377nPvE8eXt7A2A01vXECHE+pE/tT/rUvqQ/7U/61L6kP+3vYvWpoij1jgDJNJ8QQgghRBNIMCWEEEII0QQSTAkhhBBCNIEEU0IIIYQQTdDidkB3cHAgODgYZ2fnJpWj1apxYkBAgD2adVkrKysjPT0di6Wxj0gTQgghRIsLpoKDgzGZTBw7dqxJ5cjtpw3n4+NDcHBwk/tcCCGEuBI1ZJpvAXAC+KuefA0wC0gEDgC9m9IgZ2dn8vLymlKEaKS8vLwmjwQKIYQQV6qGBFMLgdvOkn870KE6PQ583vRmCSGEEEJcGhoSTG0B8s+SPxxYDCjATsALaNP0pgkhhBBCtHz2WDMVBKTV+JxefSzrbBfpdDrbrqU1abVa23qnprBHGQ21ZcsWnnnmGfbv339GXlRUFIsWLaJt27YAdOzYkWXLlhEREcHrr7/OJ5980uT6nZyc2Lt3L9dffz25ubnnVYZWq63z51GTl5fXeZUt6id9al/Sn/YnfWpf0p8KDg7g5ASOjgpOTlQnBUdHcHBQX0++d3BQ3+t06vkODuDgADqdgk6nvnd31xIbq2fnzub7Vhd7Afrj1QlfX9+LXLV9JCYmMmbMGDZs2ADAnXfeiclkqjOQqsv48ePZvHkzV199daPqffHFF3nooYcICwsjNzeX2bNn89577wFQUVHBwoULmTBhAi+99FLjvpAQQggBgIKzM7i7KxgManJ3V3Bzo/pVwdX15Cu4uiq4uCi4uJx6r9dje3V2VnB2ASc96J1Ar1fQOylo7b4pk5l3v+vPzp1x9i64wewRTGUAITU+B1cfq8vc6kR2drZS13N0AgIC7HoH3oW4m89qtdrK/c9//sPixYvrrefk8ZOvoaGhfPXVV41ul6IojB49mgMHDhAREcG6detISUlhxYoVACxZsoT9+/czceJEKioqGv2dqqqqGvxcI3mmlP1Jn9qX9Kf9SZ/a14XsT40GvLzAz+9UatXqVPLxUV+9vMDTU309mRwdG1aHxarBXOlEqUVPmVVPmaKnrMqZcpwpxZVCjQvlWlfKcaZScaKiyolysxMVxU5U4khF9bFKHKlUHLEoDtWvjlitWqosOqoqdShWHZpKHYrVAa3FAY3VAa3VEZ3VAa3VAa1Fh8aqI3vjdozG3y9Yn56LPYKpH4FxwFfANUAh55jiu1QtXryY0NBQVq9ejdVqZdq0adx4442MGTPGdo6zszOff/45w4cPJysri+joaFvehg0biIqKYuDAgXz44Yf07t2bhISEBtX9zjvv2N7//fff/PDDDwwYMMAWTGVkZGA0Grn22mvZsmWLnb6xEEKIlsLBAdq0geBgCAqCwEBo3VpNbdqorwEB4Otbf1BUUakh3+REYakzhRWuFFrcSa/yoDjfk+LCVpToWlHi5INZ60lJlTslVW6UVLlhrnLFXOVKaZULZsUVS7kGXWkFDqWVOJVZ0VdU4VIOLhXgatHhbtHhbnHAYHXC1arFuQKcLGq+pwX0lQpOFtBXqsedKkFTUYmlrJSKilLMFjOlllJKLaWUWcoosxaqr5YyyqxllFvK1VdrORonLX8bD13cH8ZpGhJMLQeuB3xR10NNAU7+mGYDa4ChqFsjmIFH7N7KFmL06NEMGjSIxx57jA0bNhAZGcmUKVPIyDg1EDdlyhQiIiKIiIjAzc2NtWvX2vKGDBlCTEwMS5YsYf78+QBMmDCBiRMn1ltnfeuYBg0axJw5c2odi4uLo0ePHhJMCSHEJUivh/BwaNcO2raFsLBTr6GhaqB0+hRZRQVk5zmQXehCVokHB1O8yU/yoUAbQIFTIAXOoRS5hVJo9aLA6oVZcUXd0QgUixVtoQkHUyn64nJcSqy4lykYyrV4lzvQqlJPhMUFP4sL7hUaXMvBrQxcy8HRCqAH9JRUlmCqMGGqMFFUUURxRTHFlcWYKkwUVBaTXlFMSWVJ7WQpwVxpxmwtw6zVYXZwxqJ3A2cPcPY8lfQeoDeAmwfog9T3egPo3dVXJ3dwcsdl23RI3nFRf141NSSY+tc58hXgKTu0pU6T74wkMtDjPK7UVL8q5zzzcGYR03463OgavLy8MJlMtY6NGDGCJ598EqPRiNFoZNasWUyePLneMmbMmMGMGTMaVe/UqVPRarW1Rr0ATCaTLG4UQogWTKdTCAurIjAQOnWC9u1PpeDg2sFSWRmkZuhIy3Fj/SEvju/zJ5sgchzbkePeiXzPTph0fiho1T957qBUVqLkG3HIMeFcUIq7yYp3SSVtS40ElJcSVOlGqMUT33In3MpAg7t6IWCpslBQXoCxzIix7DjGciN5ZUaOlhdQWF5IQfVrYXkhhRWFFJUXYaowYVGqn56hN4CrL7i2Alef6tQKvALBxftUcm0Fzl7g4qm+nkt5EZQVQblJTWWFUJgOFepnZ00lDsf32f1n1Rgtbgf0S4nRaMRgMNQ6FhgYSFraqZsbU1JS7FrnU089ZRshO31tlMFgoKCgwK71CSGEaDyNRh1h6t4dunVTU+fO0KFDAXr9qfOys+FoigNbD3pybGdr0qvCyXC6ihMe3Sj064rG2RW8URNgyT6BNjsXlwQTnoWJBJuOElTiRFi5Ox0qfAir8kZLK6CVrQ5ThYkccw4nSo+Ta85lY+kJ8krzyC3NJa80j7yyPPJK8ygoL0CpOQCh0ajBkXsAuPuDwR9ah6vv3XzBza86Vb/XOdXdGVUWKDWeSqYsOBEHZQXVxwrUAKns5GthdfBUnZSzD4q4nONO9IuhxQdT5zNiBBfucTJKjR9qYmIiGo2GwMBAMjMzAcjKyiIkJITDh9V2h4aGnrW8SZMm8corr9SbXzNYe+SRR5g4cSKDBw+uNbV4UufOnW13+AkhhLg4HBwgMhL69IGrr4bevaFrV3BXB3yoqoKjR+Fwop6Yw4EcLWtHQlUH0jyvpTykCzpPA3hWn1taSmVqGo5H8/DYuQN/YxVhxc60NxvobPEjWB9AzUCp3FpOZnEmWSVZ/Fm8n59LjnO85DjZ5myyS7LJNmdjtpjPbLSTO3i0AY8gaN0PDIHgEQiG1qeSmz/o6lh8VWmG4hwoyYGiTDh+AEpywZx36tWcB+Z8KM1vUEB0qWvxwVRLk52dTXh4OBs2bKCyspL169cTFRXF8uXLAVi5ciWTJk1i165duLm58fTTT5+1vOnTpzN9+vRz1jty5EjeeustbrjhBpKTk8/IDwwMpFWrVuxszo02hBDiChASAtddB/37wzXXQM+ecPKJXEVFsG8/LPzWiyNFbUnQdOdYq4EoEd3RhXvayrCcyMGSlIzruu345VQSVuBAl2IvuhFEsFs4EG4794T5BGmmNPaYdvC9KZ10UzpppjQyijPIK6vn8WtuvuAVBiG9wCsUPINrpBBwqWN6zZynjhqZjqsjR8XZ6vvi7Op0Qk0VxXbszcuDBFONNH36dD7++GNmzpzJm2++yZw5cxg3bpwtmHrjjTeYPXs2ycnJZGZmEh0dzbPPPtvket988018fHzYvXu37diSJUt44oknADXYWrRo0XltiyCEEKJuGo06ynT99TBokBpABQWpeWYz7NkDs5d48FdRB+J0fclqMxinzl3QBqhTXlWlpZT//TdOG7bTKtPMVcWudC/yIlITQhv3U4+yLbOUkVyWzIHC/Xxf+C3Hio6RUpRCalFq3SNLWgfwDoPgXtCqHbQKB+924N1WDZ6c3GqfX2qEwjQ1pe6AwgwoSoeiLHV0yZQFlrIL04lXAI3STENve/bsUfr27XvG8U6dOhEfH9/k8i/UNF9dtm3bxrhx4xq8cae9OTk5ERsby+DBg8nJyTmvMhrS7yfvLJT9ZuxH+tS+pD/t70rs0y5dYMgQNYAaPFjdlwng2DHYvlPHn+nBxFb2JTlgCI7deqPzUG+SqiopoezQYZwT0gnKKCcy34W+FUF08uqIq6MroC7yTi1OJS43jgRjAgkFCSQVJJFZkkmVUnVmY9x8wa8T+HQA3/bgU52826oB1UkVJWBMBuMxNRWkgjEFClKgIO2yHk26WL+jiqL8CdS547aMTNnBwIEDm7X+iooKOnfu3KxtEEKIS1WrVnDzzXDrrXDLLadGnpKS4MefHdiRHsGf2uvJbz8E526d0fRyQKmqgoQEKtbF0PpYEV2znbm2Mphurbrg6tgLgBLXEuLL4lmVsIr4/Hji8+Mp0BZQWVV55h9+Vx8I6AoBkWrw5NtRfXU9tT6KSjPkHYXjf8Gh7yA/qTolq9NwotlIMCWEEOKK07kzDB8Ow4ap6560WsjPh/UbNWz6ux07q27A2PFmnPt0QXONA1Xl5VQdOIB18TeEp1ZwbZ431xq6EWy4A4BKz0ri8uP4LvE7DuYc5FDeIVKKUmrfHQd4tfKlyqcjhLSF1t1OBVDuAadOMudBTjwc/kF9zTkCeQlQlHHZL+SuydVJh4+7E75uenwNenzcnPBxV19bVScfdyd8Dc7M35HB3I3NN3oqwZQQQojLnkYDAwbA3XerQVT79urx3bvhfx95sLXgWo4EDsOl33Vou7mq+zUdOIB10dd0TC5ncEFrrvXpTSvnXqCHPO88/sz+k6VxSzmQc4D4/Hgqqk5bs6p1AP/OENgbAntBmx4UBHQBh+q9ESpL1YXeCesg+zCcOAzZh9S75C5TDloNfgY9fgY9/rZXZ9sxX3c9vu5O+Bn0uDrVHaKYyirJL6kgv6SCrMIyEnLLSC9o3vVeEkwJIYS4LGk0cO21cP/9cN996uNXysthw0aYtSKEzVVDKe47HP3QdgA4pqZS9uNaIuKLiMrxYUCrPgS49gA3yFQy2Zq+lT3Ze9ibvZdUU+qZFXqGQEg/CO4LQX3UkSdHFzWvtACyYtHHLkKXcwjz0Z3qaFPVhV/Xe7G0cnOitYczAR7OtPbU09rThQAPPQEGZwI89PgZnPFxc0Kr1ZxxbV5xObnFFeSYytmXWkBucXl1qiC3uJy86tf8kgrKLbXXltX3pJCLSYIpIYQQl5Xu3eGhh2DECPUxLGVlsOYXDT8e6MR2l3vRDLgVh3t9UCoqsOzeg9sPm+l3zIFbHLoT6TNcHXnyyeOP43/wR9Yf7Dy+k3RTeu1KtA7QpjuE9lcDqJB+YGij5lWUQFYs7JkPGXshc5+6tglwrf7Db77EFvS7OekI9HIhyMuFIG8X2ni60MbLmUBPF9p4OtPG0xm9o67WNVVVCrnF5RwvKiOzsIz9aQVkF5VzwlTGCVM5J4rKyTGpQZOl6tKevpRgSgghxCXP3x9GjoR//1vd96miAn5Zp+GNRR3Z6nY/mkF3oOvsgdZkonTrdkL2Z3FLli83+fTHU98Pi5+F2JxYPtr7EdszthOfH197vZPOCYKvhrD+EDZADZ6cqnflNB6D5K2QtgvSd0P2X5fciJO73oGQVi4Ee7sS7O1SndT3QV4ueLnW3t3cYq3ieFEZWYVlHEgv4NdDZbbP2YXqa05xOdZLPEhqKAmmhBBCXJK0Wrj9dnj8cRg6VN2JfPdueGFmKL9q/4Vl0N3oRnihKSqiPGYLV+3L4878UPr7D0Kv01PQqoBNaZvYnL6ZnZk7MVXWeNaqRgute0B4FIRfD6HXgqMrKFXquqZ9SyHld3XPpkvkTjp/g562vm6E+bjS1seN0FauhLRyJbSVK63cagdLJeUW0oxmMoyl/JliJMNYSmZBKRnVKcdUzhUSJzWIBFNCCCEuKa1bw6OPqkFUaChkZcEHcw18X3AX2f0exml4CNaSEso3bqHDvhMMz2/LQL+bcNA7kO6ezsojK9mYupF9J/ZhVWqMIBlaQ8QQ6HCzGkC5VK/FOXEY/lwIyVsgdae6AWYL5e3qSDtfd8L93GjneyqF+bjWWtBdaa0iw1hKar6ZtQezSM03k2Y0k5ZfSrrRjNFc2Yzf4tIjwZQdnG3TzqioKJYsWUJISAgAHTt2ZMWKFURERPDqq6/y8ccfN7l+f39/Nm3aRM+ePWUHdCHEZWvQIHjmGfWOPAcHWLdew6vLrmZH6JM4DbkWpaoKy45dtFm+iXsyg4nyvR5HR0fSXdNZeGghvx77lfj8GpsTa7TqiFOHW6HDTdC6u3q8KBPif4akGDWAKj7RPF+4HloNBHu70t7fnfb+7kT4uRPh50aEnzveNUaYKq1VpOaZSc4rYXtiLsfyzKTklXAsr4TMgrIrZgruYpBgqpGSk5N57LHH2LBhAwB33nknJpOpwbufv/zyy8TExNCrV69G1TtlyhReffVVysvLbce6d+9OcnIyJ06cICYmhscff5xPPvmkUeUKIURL5uioLiR//nn1QcJ5eTAr2pOvTQ+QP/ARdP/wRElOxnH2V9z2tyt3ew7C4NSX4+7H+TLuS3499iuH8w7XKNAVIm6Eq26HjrepO4xbKyFtJ/w2BRJ/U6fxWohgbxeuam3gqgAD7f3d6RhgIMLPHRenU4u9c0xlJJ4o4eeDWSTlFJOUU0JSbgkZBaUSMF0kEkw10dixY/nyyy8bfH5YWBhfffXVedW1YsUKHnrooTrzli5dypw5cySYEkJcFry8YOxYGDdO3ZE8Lg6enRXJr/4voB08QL0Tb+NWeu7M5+GKvoQY7qXEq4TfUn5j9dHV7D6++9QCcmdPNXiKHA7hN6jbFZQWQMKvcGQtJG6A8qJm/b6uTjo6tTYQ2caDTm086NTaQMfWBjycHW3nZBaUkpBtYkdSHgnZxSSeMJGYU0xRqaUZWy5AgqlGWbx4MaGhoaxevRqr1cq0adO48cYbGTNmjO0cZ2dnPv/8c4YPH05WVhbR0dG2vA0bNhAVFcXAgQP58MMP6d27NwkJCXZp265duwgPDyc0NJTU1Dr2PxFCiEuAn586CvXUU+DhAetjHHjhmyHs6z4eh1uDsaSm4j13Ffcl+HCr10B0eh0783byyb6PiUmLodRSqhbk7AlXDYUud6sjUTon9SG/fy6EI2vUxeNVzROEeLk40M3Xl65BnkS28aBzoAftfNxs+y8VllYSf7yI7/ZmcOS4ifjjJhKyTZjKJWhqqSSYaoTRo0czaNAg2zRfZGQkU6ZMISMjw3bOlClTiIiIICIiAjc3N9auXWvLGzJkCDExMSxZsoT58+cDMGHCBCZOnFhvnTU3I7vrrrvIy8sjKyuLTz75hNmzZ9vyrFYriYmJ9OjRQ4IpIcQlJygIXnoJ/vMfcHaGVWtcmZP+EOnXjkF7mwvWXXvotng3Y0r6Eug6nFyXXBb8tYBvE789tQeUgx463wXd74cOt6ifC1Jh1xw4/D1k/HnRH8fi4exAt2BPegR7qa8h3gR6OtvyU/JKOJxVxPf7MjicVURcZhGZhc27m7dovJYfTN02Xd1FtpGsnNxhtQH/4Rw/CL9ManQdXl5emEymWsdGjBjBk08+idFoxGg0MmvWLCZPnlxvGTNmzGDGjBnnrGvlypXMnTuX7OxsrrnmGlatWkVBQUGtKUOTyYSXl1ejv4cQQjSXwEB47TX17jyNBpb/5MkXRU+Q0+8hlNBKNL9u4bY9CqOcBqDX9eT3gt+ZuettNqdtxqJY1IvCBqgBVJfh4OylblWw+wv4a5UaQF0kOq2GTq0N9Ar1pleIFz1CvGjv727LT84t4WBmMSv2HuePxOMcyiikqExGmy4HLT+YasGMRiMGg6HWscDAQNLS0myfU1JS7FJXXFyc7f2OHTv46KOPuPfee2sFUwaDgYKCArvUJ4QQF5KvL0ycCE8+CTodLFrtx4LKFyjsdTdWkwmPFb/xyCFfBrvdgNnBzHcJ37EsfhnJhclqAYY20HMU9HoQWrWDimKIWw0HVkLy5ouyaaaHiwN9QlvRO8yLPmHe9Aj2wk2v/lnNMZWzP62A7/ZlEJtWwIH0AorKLLbZBuMltgO6OLuWH0ydx4gRgE6n3ulgtdr3PyilxhBxYmIiGo2GwMBAMjMzAcjKyiIkJITDh9W7R0JDQ89a3qRJk3jllVfqzT89WKvZDo3m1PONdDod7du3JzY2tsHfRQghLjYPDxg/Hp57DlxdYflaH2ZXvkJ+16FYcvNos/AXnkruQKTzENKr0pm5eybfJ3yvbqipdVCn8XqPVveD0urUrQs2vQVxP0Gl+YK23d+gp1+7VvRt24p+7VpxVYABrVaDxVrF4awiVu5JY2+Kkb2pBWQUlF7QtoiWpeUHUy1MdnY24eHhbNiwgcrKStavX09UVBTLly8H1Om4SZMmsWvXLtzc3Hj66afPWt706dOZPn36OesdNmwYW7ZsoaCggL59+/LMM8/UCsL69evHsWPHZL2UEKJFcnBQN9l84w11VGrVOi8+KxlPVuQ9WE7kEPHFbzyTEUmI000cLjnMS7te4reU39RNNQ2tYcBT0OdhdUSqKAO2va/uQm5MvmBt9nV34tpwH64L9+G6CB/C/dQpu5JyC3+mGFlzMIvdx/KJTSuktPLSenyMsC8Jphpp+vTpfPzxx8ycOZM333yTOXPmMG7cOFsw9cYbbzB79mySk5PJzMwkOjqaZ599tsn1PvDAAyxYsAC9Xk96ejozZsxg8eLFtvxRo0bVWpAuhBAtxdCh8O670LkzbNrlxsxtz3Os8yiseXm0j45hfEZ3/HQ3sDN3J//963V2ZO1QL2w7CPo+Bp3vVDfYTFwPq5+DhHXqY13szNVJxzXtfBjc0Zf+Eb5c1VqdGTCVVbIrOZ9lf6TyR3I+hzOLLvkH8wr70igX+c6Gk/bs2aP07dv3jOOdOnUiPj6+jisa50JN89XlbDugXwx+fn55EIMAACAASURBVH5s3ryZXr161drUszEa0u8y129/0qf2Jf1pf03p027d4P334aab4O+jDrx18CH+6PwSVmMhET8dYHxqF/y1nmxK28Ts2NkcyjukbmHQ7V647ikI6ArmfNi3BPYssPsolEYDXQM9GdzRj0EdfOkd6o2Tg5bSCiu7j+Xz+9FcdhzN46/MIrttfim/o/Z3sfpUUZQ/gavrypORKTsYOHBgs9afk5NDZGRks7ZBCCFO8vCAadPUDTcLCjW88uMQVrd7m8q2WkK/2cnLCVfRmv5sytjE07GfqzuUu3jDoPHQ7z/qtF72IfjhKTj4DVjst1WAh7MDAzv4cmMnf6I6+uNn0APwV0YhC7YlsyUhhz9TjJRb7D/yJS5fEkwJIYSwm1Gj1Ck9f39YuOkqZnvOwtQ+CO8N+xi/P5iO1r5sTtvMs7GfqUGUZzDcPhN6P6Q+6iVxPXw3Vn0unp2EtnLl5sgAbo4M4Oowbxx0WgrMFWz+O4eY+By2JuSQVyLPNRXnT4IpIYQQTdalC3z2GQweDLsPuzPm6JskBN2Kfvdhnt+WTv+ynuw7sY/Rf77AvhP7wCcChn8C3R9QCziwAnZ8Aifizl5RA3UL8uSWLgHcEtnatvYpLquIOVuS2Bh/gv1pBfLcOmE3EkwJIYQ4b3q9uunmhAlQaNLy0sb7WRP0GkppNiPmJXBvbkcSCxJ5eu/TbErbBP6d4d4FEHk3WCvUtVC/z4LC9Ca1Q6OBnsFe3N6tDUO7tSbY2xWLtYrdx4xMW32I3+KyScuX7QrEhSHBlBBCiPMyYADMm6fepbdiVyc+cJ9NobeB3qviGH/0KgpM8Pq+1/nx6I9UtQqHe+ZD13+qG2z+Pgt2fAolOU1qQ49gT4b1DOT2rm0I9HKhwlLF1oQcPlqfwG9x2RSYK+30bYWonwRTQgghGsVggOnT1YcRp2Q58cieyezyuge/bfF8uNsV35K2LDw0jy8OfoHZ4H9qOs9SCts+gN8/htLzv/Mqws+dYT0DGd4jkLa+bpRbrGz5O4d3fj3ChrhseUSLuOgkmBJCCNFgN94I0dEQHAzzdvdnjucsyopKGPP1cYZkt2fdsXW8/+f7ZFAJt76p7lZeZYGdn8H2D6Ek97zq9XFzYnjPQO7pE0yXQE+sVQq/H83l05hEfj10XAIo0awkmBJCCHFOLi7qaNSzz0JChhsPHH6fg6796bU2lfEHQ0nNTeSRnS+xJ/8w9B8HA54FnR7+XAhb3wXT8UbX6ajTcGMnf+7pHcwNnfxx1GmJTStg6o+H+PlAFjnF57evnhD2JsGUHZxt086oqCiWLFlCSEgIAB07dmTFihVERETw6quv8vHHH1/w9o0bN47g4GAmTpx4wesSQlx+evWy8Omn0KkTzD94PZ/q38fhaB5vbiojNMePT2M/YHH8UizdH4AHl6r7RB3+AdZPhfykRtcX4efGA/1C+WevIHzc9ZwoKmP+1mS+2ZtO4oli+39BIZpIgqlGSk5O5rHHHmPDhg0A3HnnnZhMpgbvfv7yyy8TExNDr169GlXv9ddfz+TJk+nduzdGo5F27drVyg8LCyM6OpprrrmG1NRUxo0bZ2vjvHnzSExM5L333iMnp2mLPYUQVw6dDiZOLOWFF8o4bnTm4bgZ/FEVxdDvjYw+3JrNqTE8/cd0svw7wOObwD8SUnfCigchfXej6tI7aLmta2tG9gvlmnAfKq1V/HY4m5V70tiakCvbGIgWTYKpJho7dixffvllg88PCwvjq6++anQ9JSUlLFiwgOXLl9d6wPFJy5cvZ8eOHQwdOpShQ4fyzTff0KFDB3JzcykvL2ft2rWMHj2a9957r9F1CyGuPGFhsGwZ9O9fxncJ1/A2s9AlmHl/owbHDCvP7XqGGNNRuGMGRA4H4zFY8RDE/dioeoK9XRh9XVvu6xOMt5sTx3JLeHttHN/8mU5usWykKS4RiqI0S9q9e7cCnJE6depU5/HGJp1Op+h0OruUdTItXrxYsVqtitlsVkwmk/LSSy8pZrNZCQoKsp3j7OysREdHK/n5+cqhQ4eU8ePHK2lpaQqgbNiwQbFYLEppaaliMpmUDh06NLoNQ4YMUZKTk2sd69Chg1JWVqa4u7vbjm3ZskUZM2aM7fPIkSOVjRs31ltuQ/rd29tb8fb2tmufXulJ+lT6syWme+5BMRpRCot1ygsJ05TOBw4o49/dosQ+fFCZct0Uxd3VV+H6iQqvHld4JVNh0HgFB32j6hjY3leZN/pqJemtoUri/25XPh3ZW+kf4aNoNM3//S9kkt/RS7dPFUXZU19MIyNTjTB69GgGDRpkm+aLjIxkypQpZGRk2M6ZMmUKERERRERE4Obmxtq1a215Q4YMISYmhiVLljB//nwAJkyYcNa1TCcf4Hg2Xbp0ISkpieLiU2sJYmNj6dKli+1zXFwcPXr0aNT3FUJcWZyd4YMPYOxY2JsRxMTyaEqOuvHerwqalBIe//0ldnl4weMbwStMfW7eb5OhKOPchaNO5d3bJ5hHBrSjvb87ucXlfBKTyNJdKWQXyWJycelq8cHUy31fplOrTo2+TqPRAKAoyjnPjc+PZ+bumY2uw8vLC5PJVOvYiBEjePLJJzEajRiNRmbNmsXkyZPrLWPGjBnMmDGj0XXX5O7uTmFhYa1jhYWFBAUF2T6bTCY8PT2bVI8Q4vLVqRN8/TV07Qpzku7ls/JXGbDZzGO73Pnx6LfMPLiY0lveUKf0TsRB9FBI2d6gslu5OTH6ujAeujYMH3c9sWkFPL9iPz8fyKLCKg8UFpe+Fh9MtWRGoxGDwVDrWGBgIGlpabbPKSkpF7wdxcXFeHh41Drm4eFRK9AzGAxnBFxCCAFw332wYAGUVjnz6LEP2ZvVmwlrtfjFlzD+wGR2Bnal9IktoHWE9W/Ajo/Beu6dxdv6uPLYoHDu7ROMs6OO3w4fZ+6WJHYfO/8NO4VoiVp8MHU+I0YAOp0OAKvVas/m1BrpSkxMRKPREBgYSGZmJgBZWVmEhIRw+PBhAEJDQ89a3qRJk+pcUH7S6cFaXQ4dOkR4eDju7u62qb4ePXqwbNky2zmdO3cmNjb2nGUJIa4cjo4wcyY89xzsyY5gfPF8fP504vONLsQcWs3YpFWYh72PtXVPSNwAP78IxuRzlntVgIGnbojgju6BWKxVrNqbzvxtyRzNKbkI30qIi0/b3A241GRnZxMeHg5AZWUl69evJyoqypa/cuVKJk2ahJeXF0FBQTz99NNnLW/69OkYDIZ600kajQa9Xo+jo2Ot9wAJCQns37+fKVOmoNfrufvuu+nevTurVq2yXR8VFVVr/ZYQ4soWGAgxMWogFZ1+L4+eWMnQ7z15/rsqpq57mVc0+Zge/YUqj2DcfnkGlvzznIFU92BP5j7Uh1+fH8yNnQOYu+UoA2Zs5JXv/pJASlzeGnj33W2KohxRFCVRUZSJdeSHKooSoyjKPkVRDiiKMvRyvJsPUIYNG6akpKQoRqNRefHFF5WhQ4cqa9asseW7uLgoixYtUoxG4xl38wFKTEyM8uijjza63qioKOV0MTExtvywsDAlJiZGMZvNSnx8vDJkyBBbnl6vV9LS0hR/f/96y5e7+ZonSZ9KfzZHGjwYJTsbxVTqoDyX+o7Sb/NuZfVLB5V5t8xT/EMHKjy+WWFqocK9CxTPwIhz9mn3YE9l4SN9lWNv36Hsn3yz8uyQDoqni2Ozf8+WmOR39NLt07PdzdeQQEqnKMpRRVHCFUVxUhQlVlGUyNPOmasoyhPV7yMVRTl2uQZTdaVt27YpPXv2bPZfqPrSuHHjlBkzZpz1HAmmmidJn0p/Xuz0xBMoFRUoCfkByh1JPykPfL1b2f7oPuU/3cco2sEvK7yeozA+QaHzsHP2aec2BmXe6D7KsbfvUPa+frPyRFSE4q53aPbv2JKT/I5eun3a1K0R+gGJwMlnAnwFDAcO1zhHAU6ugPYEMhtQ7mVj4MCBzd2Es/rkk0+auwlCiGbm6AgffwxjxkBMbj8mnviQe9a50XNbNuNiZ7HvhhcgqA8cWAm/TABzfr1lRfi58/xNHbizRyBFpZW8u+4I0duSKamw7xpVIS4VDQmmgoC0Gp/TgWtOO2cqsA54GnADbjpXoTqdrs49lLRarW3xeFPYo4wriVarPeeeVl5eXhepNVcO6VP7kv6sm69vFYsWlXDddRbmZj/C/GNPMfEHPcf/3Mq/yxM4fv88NNYKXH9+AqfEtaAH9Oq/BzX71M/dkbEDQxnezZ+yyirm/Z7Gl39kYiq34uTmgZNbM33BS4j8jtpfS+hTe93N9y9gIfAecB3wJdAVOH0DkcerE76+vnaqWgghRH26drWwbFkJvgFaxme+S/yBIcz8AZbuX8DCjgOoDB+FQ+pW3NaNR1uSXWcZro5aRg4K4cG+gThoNXy1N4v5v6djLLVc5G8jRMvUkGAqAwip8Tm4+lhNjwK3Vb/fATgDvsCJ086bW53Izs5WjMYz9xoJCAiw63YG9t4a4XJVVVVFXT+PujT0PNFw0qf2Jf2puuMO+OorMGm8eTBjHoFb2vPcmnye/3sZ+4ZMAGcPWDsByx9zKKxjg2OdVsOIXq0ZMyCEVm6OrI7N5J1fj5Cab26Gb3N5kd9R+2vOPm1IMLUb6AC0Qw2iHgBGnnZOKjAEdXSqM2owlWO3VgohhGiUcePgww8hrqQDT2fM4Z41/riv38MDVVnkDX8Psg/B4uFw4nCd1/eP8GHKXV24qrWBPamFPBx9kAPpsvGvEHVpSDBlAcYBvwI6YAFwCJgG7AF+BF4E5gHPoy5Gf7j6VQghxEWk1cL778Ozz8KGgsFMTZzBi6vc2bblGz7q1B9L6D9gTzT8MhEsZWdcH+ztwmt3RHJb19ak5pl54dt4YhLyMRolkBKiPg1dM7WmOtVU84Fzh4EBdmmREEKI8+LmBsuXw113wcK80Sw/8ByvrbTywYGl/DpoLGh18M3/wV+rzrjW2VHLUze05/FB4VgVhZm/xDN/WzKuBnmmpxDn0uIfJyOEEOLc/P3h5zXQq5eGadmvkbDzPp5ekc3zhfHE3TIJMvfDN49AftIZ197YyZ9pw7sQ7O3Kd/syeHttHNlF5QC4XuwvIsQlSB4nYwfbtm2jZ8+edeZFRUXVevBxx44d2bdvH0VFRed81Iy9jBs3jrfffvui1CWEuPgiIuD3HRq69HBiXOanlK15gJu/OMTDTpXE9RsNf8yD+TefEUi18XRm9oN9WPBwX8wVVkbM2cHzK/bbAikhRMNIMNVIycnJDBkyxPb5zjvvxGQysX///gZd//LLLxMTE4OHhwcff/xxg+sdP348Bw8epKioiKSkJMaPH18rPywsjI0bN1JSUkJcXFytNs6bN49Ro0bh5+fX4PqEEJeGPn3g950avIPceSRtEV1WDEa/bBOPdehBXnAv+PZxWDMerBW2a3RaDY8Nasf6F6KI6ujH22vjuGPWVv5Irn+jTiFE/SSYaqKxY8fy5ZdfNvj8sLAwDh061Oh6NBoNo0ePxtvbm9tuu41x48Zx//332/KXL1/Ovn378PHx4dVXX+Wbb76x7eVVXl7O2rVrGT16dKPrFUK0XLfcAps2a6hwD+CR5GXctbALu37bxNRr76PSWgFf3AwHVtS6pnMbA98/OYDX7ohkR1IeN3+wmdmbk6i0yj1DQpy3Bj7o2O7pUnw23+LFixWr1aqYzWbFZDIpL730kmI2m5WgoCDbOc7Ozkp0dLSSn59/xoOON2zYoFgsFqW0tFQxmUxKhw4dzrstH330kTJr1iwFUDp06KCUlZUp7u7utvwtW7YoY8aMsX0eOXKksnHjxnrLk2fzNU+SPpX+PN80ahRKRaVGOVzSUblj70blm+f3KNffs1x9QPHIFQrOXrXOd9Jpledv7qgk/O92ZferNym3d20tfdoMSfrz0u3Tsz2bT0amGmH06NGkpqZy1113YTAY+Pnnn6mqqiIj49QeplOmTCEiIoKIiAhuvfVW/v3vf9vyhgwZwtatWxk3bhwGg4GEhAQmTJiA0WisN9Vn0KBBthGuLl26kJSURHFxsS0/NjaWLl262D7HxcXRo0cPe3aHEKKZjBsHS5bAn2V9mbRvIY98pmNyoYlN3YbCprdh+QNQVmA7v0ewJ6ufHsizQzrwY2wmN3+wmbV/HW/GbyDE5aXF380XMGkS+s6dGn2dBg0ACso5zy2Piyd7+vRG1+Hl5YXJZKp1bMSIETz55JO2YGjWrFlMnjy5nhJgxowZzJgxo1H1Tp06Fa1WS3R0NADu7u4UFtbeA6awsJCgoCDbZ5PJhKen3OIsxKXutdfgv/+FDaYhzN8xkxELs3nKL5Rs91awcjQc/sF2rpNOy/M3d+DxwRFkF5XxcPQfbDoi+ykLYW8tPphqyYxGIwaDodaxwMDAWnfvpaSk2LXOp556itGjRzNo0CAqKtQFpcXFxXh4eNQ6z8PDo1agZzAYzgi4hBCXlnffhRdfhO8Lh/PTpmn0/zKJxzv2o6Q0HxbcCscP2s7t1NrAB/f3pHMbD5b/kcpbP8dhKpdn6QlxIbT4YOp8RowAdDodYP9n8yk1nl+VmJiIRqMhMDCQzMxMALKysggJCeHwYfURDaGhoWctb9KkSbzyyiv15tcM1h555BEmTpzI4MGDa00tHjp0iPDwcNzd3W1TfT169GDZsmW2czp37kxsbGwjvqkQoqXQamHuPA2P/p/CEuOD7PllAmHfJvF81xuwpO2EFQ9CSa56rgb+MyicF27pSFFpJf+3cDcb409/TKoQwp5kzVQjZWdnEx4eDkBlZSXr168nKirKlr9y5UomTZqEl5cXQUFB59xLavr06RgMhnrTSSNHjuStt97i5ptvJjk5uVYZCQkJ7N+/nylTpqDX67n77rvp3r07q1ad2uU4KiqKtWvX2qMLhBAXkYMDLF+h5dH/U/gs9wn+/nYiVaszmNwlCsv+JbBomC2QCvZ24avHr2PS0M5sjD/BrR9ulUBKiItB7uZrXBo2bJiSkpKiGI1G5cUXX1SGDh2qrFmzxpbv4uKiLFq0SDEajWfczQcoMTExyqOPPtroepOSkpSKigrFZDLZ0ueff27LDwsLU2JiYhSz2azEx8crQ4YMseXp9XolLS1N8ff3r7d8uZuveZL0qfTn2ZKTE8oPq3WKoqDMyH5ZmTHroPKvh7eod+wNfKHWuXd1b6McmHqLcmDqLco/egXZrQ2XW582d5L+vHT79Gx380kwZYe0bds2pWfPns3+C1VfGjdunDJjxoyzniPBVPMk6VPpz/qSszPKml8dFEVBmZb5uvLx9Fjl5rH7FF7LVujyT9t5Lo46Zea93ZVjb9+hrHqivxLs7SJ92oKT9Oel26dnC6Za/JqpS8HAgQObuwln9cknnzR3E4QQjeDiAj+uceDGKCtTMqbRev6dRBtd2e2hU6f10nYBENnGg4//1Yt2vm7M2pDARxsSsFYpzdx6Ia48EkwJIUQL4uYGP//qyMD+Vl5Pf4vQuTczq8Kfw5bjsHiE7fl6/+7flleGdsJYUsmoL3axIymvmVsuxJVLgikhhGghDAb4ZYMT/fpYeDV1Bu1mRzFTE0pSXiwsGwGlRtycdMy4pzt39ghkQ1w247+OxWiubO6mC3FFk2BKCCFaAHd3+GWjnr69LbyS8j7hn13Hf/URZCT9Bt88ApWldAxw5/NRfWjr68b0NXHM3ZqEIrN6QjQ7CaaEEKKZubvDLzF6+vWx8Frye7T95Dped+tA7oGl8NNzUGXlH72CeOsf3Sgur2TkvJ3sSs5v7mYLIapJMCWEEM3IzQ3WbHDmmj6VTE56h8BPBzDJPYKibe9BzP9w1GmYcndXHrw2jF1JeYxbvo8cU3lzN1sIUYMEU0II0Uzc3GDNRmeu61vJ1OSZ+H02mFfd21H8y8uw+wv8DHo+H9Wbq9u2Yvamo7yz7ojcrSdECyTBlBBCNAMXF1izwYUBfcuZmvwO3p/eyGsuQZi/exz+WkWPYE/mPHQ1Hi4OPLV0Lz8fzGruJgsh6iGPk7kAli1bxvDhwy94Pe+++y5jx4694PUIIexLr4cf17kyoF8505Jn4P75Tbymb4155YPw1yru6xPMyrHXUWGp4p+f/S6BlBAtnARTjZCcnEx2djaurq62Y48++igxMTG2z926daNHjx788MMPtmP/+te/OHbsGMXFxXz33Xd4e3s3qD5HR0e+/vprkpOTURSl1jMAQQ2mXnnlFRwdHZv4zYQQF4ujI6z62ZWbBpqZfuxN9J/dymQHb8qW3YPu6G9MHdaFd+7rwe5kI8M+3Ub8cVNzN1kIcQ4STDWSTqfj2WefrTd/zJgxLF261PY5MjKSOXPm8NBDDxEQEIDZbOazzz5rcH3btm3jwQcfJCvrzP8zPX78OPHx8QwbNqxxX0II0Sx0Olj+vSt3DDEzM2UyyufDmKp1o2LRMDyy/yD64b483L8tX2xN4t/Rf1Ag+0cJcUmQYKqR3nnnHcaPH4+np2ed+bfffjubN2+2fR41ahSrV69m69atlJSU8Prrr/PPf/4Td3f3c9ZVWVnJRx99xPbt27FarXWes2nTJu64447z+zJCiItGo4FFK125Z6iZD9MnUP75/fzXqqMy+nZCy//m2ycHcF2EDy99E8ubP8fJQnMhLiESTDXSnj172LRpE+PHjz8jz9XVlfDwcI4cOWI71qVLF2JjY22fk5KSqKiooGPHjnZpT1xcHD169LBLWUKIC2ful66M+qeZzzKfpejzh/lveRWVC++gnyGX758agI+bEw/N38XXe9Kbu6lCiEZq8XfzffAB9OzZ+Os0GnUkpyG7A+/fD88/3/CyJ0+ezPbt2/noo49qHffy8gLAZDq1xsHd3Z3CwsJa5xUWFmIwGBpe4VmYTCZbvUKIlun9z115bJSZBccfJ+ezsfyvuILKxXdxX0QV//vHNaTlm/m/RbtJyTM3d1OFEOdBRqbOw6FDh/jpp5+YOHFireMFBQUAtQKl4uJiPDw8ap3n4eFRK+BqCoPBYKtXCNHyvP4/F54fa2Z5zoOkfPYcbxWaqVx4Oy/0dead+3qwKzmPf3y+XQIpIS5hLX5kqjEjRjXpdDqAetcaNdWUKVPYu3cv7733nu2Y2WwmMTGRjh07kpubC6iBV81puHbt2qHX6/n777/t0o7OnTvXmkYUQrQcT7/kzLRXSvnReDdHPpvE27lFVC27m/duC+Ce3sF8tTuV1777C4usjxLikiYjU+fp6NGjrFixgmeeeabW8TVr1tTawmDp0qXcddddDBw4EFdXV6ZNm8a3335LcXExANHR0URHR9dbj5OTE3q9/oz3J0VFRbF27Vp7fS0hhJ38+zEnZs0sY2PREPZ+9l9mHC/AcflwFt0Xxj29g3l33REmrjoogZQQlwEJpppg2rRpuLm51To2d+5cRo0aZft8+PBhxo4dy9KlSzlx4gQGg4Enn3zSlh8SEsL27dvrrePIkSOUlZURHBzMunXrKCsrIywsDIDWrVsTGRnJ999/b+dvJoRoirvvc+SLORZ2Fl/L1jnvMTO9CI/vR7Dq4Y70a9eKF1bu55ONic3dTCGEnbT4ab6WpF27drU+p6en4+LiUuvYoUOHiI2NZfjw4baNO5cvX87y5cvPKM/R0ZHAwEAWLlzY4DprGj9+PG+99RaVlbIXjRAtxY0361ixXOFQeVfWzf+Ed5NKCPplJEse6YSrXse/F/zB70fzmruZQgg7kmDqAqg5MnU2lZWVREZGnnc9dW3PIIRoPr2v1vDjT44cs4Tww6I5vBdfTvuY0Sz+91WUVFi47/MdHMmWHc2FuNxIMCWEEHbQvj2s2+RGgcaDFcvn8WGsQs+djzL3wQ5kGEt5aP4uMgvLmruZQogLQNZMCSFEE7VpAzF/eIHeiegfv+DjHXoGHRhD9Ihw4rOKuHf27xJICXEZk2BKCCGawMsLYvb44u1Zwez1s5mzwY+hR59m1rBQtiXkMPKLXRjlGXtCXNZkmk8IIc6Tiwus2+lPu9ZGPtg+mwWr23N3xjOMvymAH/ZnMP7rWCqtsvWBEJe7FhdMWa1WHB0d5Q61i8jR0RGLxdLczRDikqLTwXcxrenTMZsP977Hoq+v5t7cF3iyvycLfz/GG6sPNehxVkKIS1+Lm+YrKCggICAAjUbT3E25Img0GgICAs54fqAQ4uzmf9uGW685ztwjr7Fkyc3cXzCRJ3s78/HGBKb+KIGUEFeSFjcylZubS3BwMFdddVWTytFq1TixqqrKHs26rJWUlNgefyOEOLc3Pwng38OyWJb6OEvm/4v7TBMZ2UXLW2vimLslqbmbJ4S4yFpcMKUoCmlpaU0ux9vbGwCj0djksoQQ4qQnJ/rw6lPZrM25m0WfP88/zFP4Z4SFV779i2V/pDZ384QQzaCh03y3AUeARGBiPeeMAA4Dh4BlTW+aEEK0LMNHGZj1lpHfCwcR/elb3Gp+i7uDTDy3Yr8EUkJcwRoyMqUDPgVuBtKB3cCPqIHTSR2AScAAwAj427eZQgjRvPrf6MJXiyqIL41k/uez6Ff0AXf65/DE0n38dji7uZsnhGhGDRmZ6oc6IpUEVABfAcNPO+c/qAHXyTm1E/ZqoBBCNLeOkQ78vMaRE1Z/vlgwj/a587mrVRqPL/5TAikhRINGpoKAmouY0oFrTjunY/XrdtSRrKnAL2crVKfT2dY1XQheXl4XrOwrlfSp/Umf2teF6E8/f4WNO/VU6SqYu2QBvunf8Q/PRJ755v/bu+/4KOr8j+OvzW6y2fRN7yF0QpWOIEXpCAiK0hRBRUE4e8Fe7jz7+Tv7naBYsaKoeAoKglIEkSK9l5De66bt74+JCogaSGCTzfv5eMxjZ3dnZz/zfSTkzcx3vt/tbM6oOKP/jtUH+hmtW2rPulcf2rSuOqBbMC719QdigRVAceyj0QAAIABJREFUeyD3hO2mVy+EhobW0VeLiJwZPj5OFi4LJNg3jWcWzcey63su8tnEzPe2szFZExaLiKEmYSoZiDvmeWz1a8c6AqwFyoH9wC6McLXuhO3+U72QlpbmPBt32uluvrqnNq17atO6VRftaTbDR982p1XkPp5d+Sw5aw9zuXUVk1/5gY2HT/x/ovvTz2jdUnvWPVe2aU36TK3DCEaJgBcwHqMD+rE+xjgrBRCKcdlPg62ISIP1xhet6N9+D69tvof9X3gyyetLJvx3TaMMUiLy52oSpiqAWcCXwHbgPYzhDx4CRlVv8yWQhXGH3zLgturnIiINziMvt2DCoJ18sP9qfngviale7zPplbVsPZrv6tJEpB6qaZ+pxdXLse47Zt0J3Fy9iIg0WNfc1oQ503fzdfoIvnj1ImaZ/4/JClIi8ifq3dx8IiKuMnBMGM89msyG/G68/fINXMezTHpljYKUiPypejedjIiIK7Tt4seH7zpILovjP//9J9eUPckVr6xiR6ru2hORP6czUyLS6IXHWFjyrT/lJk+ef/1ZJuf9H1Nf+V5BSkRqRGFKRBo1H19Y/lMiQbYcnv/oeYYfmcf0V5YrSIlIjSlMiUij5eEBX2w4h1ahe3h52RN0+/kT/jZ3CdtTFKREpOYUpkSk0Xp9SU/6tvyJ1zfOIW7FJm6b+7k6m4vIKVOYEpFG6aGXejDp/DV8tv9yLB87eHDu+wpSInJaFKZEpNGZclMH7pq+jlWZAzj8RkueenUuW5LzXF2WiDRQClMi0qj0HZ7AC0/sZk9xa1bPvYhX5j6tKWJEpFY0zpSINBrN2gTxwUcl5FcGsvDVm1n48u1sOKQJZ0WkdnRmSkQaBX+7J1+uCcNmKeK1BQ+x6Jk7+GF/tqvLEhE3oDAlIm7PbIalWzqT4L+PVxY/wuK/383qvZqLXUTqhsKUiLi9D9cPpXvMWt5YPYdFcx5n5e4MV5ckIm5EYUpE3NozC8cwutP/WLTrSt6+/l2WbU12dUki4mYUpkTEbd3w6Chmj/6Y79MG8Z+pW1i6cberSxIRN6QwJSJuadS0/vzztiXsKmzHv6db+HzVj64uSUTclMKUiLidTn3aMvfFreSWB/HUbefw3qIvXF2SiLgxhSkRcSsh0aF88EU53uZinnnyYl55+XVXlyQibk5hSkTchqeXJ29/E0mC716ee+s6Hr/nOVeXJCKNgMKUiLiN11b0p1v4Sl5fNoM5U55ydTki0kgoTImIW5i/4nqGtXyPz7ZN4KoLdEZKRM4ehSkRafCeWnAbk/q8yJqUAVzZ7ytXlyMijYzClIg0aPc8eTPXXfIcewtaM6HvPqoqq1xdkog0MgpTItJgzb5pOrNnv0lBRSCjLygnLyvf1SWJSCOkMCUiDdIV48cw+6EV+JiLuGJKIjvWa3RzEXENhSkRaXDGXdCH6/+dTaLvbm59uC9fvbva1SWJSCOmMCUiDcqF3ZK48uUEuod9y9MLRvLygxrdXERcS2FKRBqMoR0TuPT5kQxv9hbvrx3GHRM/dnVJIiJYXF2AiEhNDG4bxfBHbmRi11tYdehcxp+rM1IiUj8oTIlIvXd+m3AGzHmIq4b+jT15rRjUfi1VGgFBROoJhSkRqdf6tQzjglmPctWld5BfFsTgbkcozq90dVkiIr9SmBKReqt38xCGXf0QF1/5KDZTCYNGBHJoT4GryxIROY46oItIvdQjMZjLrriDAVe9RRPbXq6ZHc+ab5JdXZaIyO/ozJSI1DvdE4O57orpRF75I92Dv+OuZ7qx4KV1ri5LROSkdGZKROqVrgl2brt8ApaxlQyNe5e5i3vxz5sUpESk/lKYEpF6o3O8nQevHE3qgOZM7vAES3/uwjUXanRzEanfFKZEpF44Jy6IJ6YOZmOHC7im7x1sTmnNhV1/xOl0dWUiIn9OYUpEXK5jbCDPXjWAL+MmM2PUbNKLwhnQaTcOh6srExH5awpTIuJSneKC+M/V5/FWwPVcP/l6qIKBvbPITtdYUiLSMChMiYjLdI4PYt5V5/Ki+WZmXHMr4Z5pXDTGg11bSlxdmohIjSlMiYhLdI63M29aT56uvIErr3uUtr6bmH5DOCsWZ7u6NBGRU1LTMDUU2AnsAe78k+0uBpxA11rWJSJurGuCnfnTuvOv0ulcfPVb9Av9iof+3ZQ3njvs6tJERE5ZTcKUGXgeGAYkAROqH0/kD9wArK2z6kTE7XRrYgSpf5dMYMDktVwU/zrzFrXkwRv3uro0EZHTUpMw1R3jjNQ+oAxYAIw+yXYPA48BpXVWnYi4lV7NQpg/rTsvFl1I+1G5XJ70OF/92JxrxuxydWkiIqetJtPJxADHnns/AvQ4YZvOQBzwOXBbTb7YbDZjt9trsulpCQoKOmP7bqzUpnWvMbXpuYlBPDWmFfMK+xHXN5jpPaey5UgTrhyZSWBg3fxb0Jja82xRm9YttWfdqw9tWhdz83kATwNX1mDb6dULoaGhdfDVItIQ9G9u57HRrXgtrwu2Dh25dugEUvNDGNs/m9JS3QcjIg1bTcJUMsZZp1/EVr/2C3+gHbC8+nkksAgYBaw/YV//qV5IS0tz5uTknHrFp+hsfEdjozate+7cpsPbR/L4Ra14Nb01Za2GMvPSS6ksN9G/WzoH9p2ZsaTcuT1dRW1at9Sedc+VbVqT/xKuA1oAiYAXMB4jLP0iDwgFmlQvazh5kBKRRuaiTjE8O6Ezb6Q1ITvucq668irsHtkMGVjCgT0alFNE3ENNwlQFMAv4EtgOvAdsBR7CCE0iIr8zqUc8T1/akTeSI9gbej1Tp8+guXUPl1xmZv33midGRNxHTftMLa5ejnXfH2zb/7SrERG3cF2/ptw5rA1z9wawMeJOZs+8ie7+a5n6NztffKTLGyLiXuqiA7qIyK9uH9KKmQOa89I2L9ZE3M/1Mx5hUMhi7n0yjNeezXB1eSIidU5hSkTqhMkED45qyxW9mvDMRidrYh7hqulzuSR6Pi8tiOTvt6W6ukQRkTNCYUpEas3iYeLxSzowtnMs/1zjYE2TfzNtykKubv4En3wbycyJClIi4r4UpkSkVmyeZp6f1JnzW4dz7/J81rV8gWnjlzOz3b18tzmCSwen4nS6ukoRkTNHYUpETlugzZNXr+xGx7ggbliczuYOr3D16E3M6nYz2w4GM6x3GmVlrq5SROTMUpgSkdMSGeDN61d1JyHEh2kfHmF3z1eZMXg/1/ebSWqWDwO7Z1BY6OoqRUTOPIUpETllzcL8eP2q7gR4W5j4zkEO9X+T2b2zuWbodBzFMKBbNhm6cU9EGgmFKRE5JZ3j7cyd0pWKqioufnM/mUMWcEPnIiZffA3elYX06V3MwYOurlJE5OzRDKMiUmND20XyzjU9yC0pZ/Tr+0gbsoAb25YzbuK1RHocZfjgUn7e4uoqRUTOLp2ZEpEamda7CfeMSOKnw7lM+/AwVZd+zK3NYMSUmTT33MWo0bBqZZWryxQROesUpkTkT3mY4J4RSUzrk8j/fk7lb5+nYZn0CXfEmjn/6ll0tG1kwmQz//u83NWlioi4hMKUiPwhb08P/nVZJ4a1i2Led/t5+LtCvK/4nDvCPehx3a308fuOa2Z68f7bGv9ARBovhSkROakwfyv/vaIrHWICefizbczdZsI25XPmBHnQdsb9DAn8klvu9uaVF0tdXaqIiEspTInI77SNDuC/V3Ql0ObJ9DfWszQjENuUT5jjX0WzWf9kbPAH/ONJG08/UuLqUkVEXE5384nIcQYnRfD+db0AGPfSapZmheA95XPu8q0iduYzTAx9k2desnHPbQpSIiKgMCUix7i2b1NemtyFXWmFjH7+e7bRFO8pn3GvVxmhM19masQrvDzfxk0zFKRERH6hy3wigtXiwSNj23Nx51g+23SUW97fhCOmJ97jF3CfKRef61/nuqhnef09GzOmKkiJiBxLYUqkkYsK9Obly7vQITaIp5fs5Nlv9uBsPhifS17jgYoMmP0+N8Q8yXuLbEydUILT6eqKRUTqF4UpkUase2IwL0zqjNXiwdXz17F0ezq0uxi/0S/yQHkypbMWcXfc31n0lY1JF5dQpTE5RUR+R2FKpJG6vGcC941M4lB2MdNfX8/ejCLoOo2AoU/wQNlBimZ+zj3x9/PFMm/GjSyhosLVFYuI1E8KUyKNjLenBw+Pbse4rnF8vT2NGxdspMBRAefdir3/XTxQuo/cWV9wT9x9/G+ZN2OGlVKmMTlFRP6QwpRII5IY6ssLkzrTKsKf//t6N/+3dBdVeMDwJwntPI37S/eSOesr7ou7j6XfenHRsFIcDldXLSJSvylMiTQSw9pF8vglHSivdDL1tXV8uysDLFYY+woxLYZzt2MPKbO+5oG4e/h6hRejhzkUpEREakBhSsTNWTxM3DmsNVef15SfDuVw/VsbOJpXCt6BMP5tmkb34LaqfRydvZQHYu/mm5WejBrqoFSzxIiI1IjClIgbi7Xb+Pf4c+icYOfV7/fzyOLtlFc6wT8KJn9Ikn8TZlkOkDZ9MQ9EP8A3KyyMGlamICUicgoUpkTc1IUdonhkbHtwwsy3fmTxllTjjYh2MOk9uuLNlf6pZF/1MfdH/Z0vllgYM7Jcl/ZERE6RwpSIm7F5mrl/VBLju8Xz48EcbljwE0dyqkctbzEILnmV/vm5jInLp2jKAu6OfJxPPrNw6cUVumtPROQ0KEyJuJE2Uf48O6EzTUN9ee6bPTyzdBcVVdVDlne9CoY/wcXJu+jZzofKia9xe/gzvP+RmYmXVWgcKRGR06QwJeIGPExwbd9m3DSoJTnFZUyau5bVe7OMN00mGPQw9JrFtXt+JLJfOD5jXmBm6Iu8tcCDKZMrqax0bf0iIg2ZwpRIAxcXbOPpSzvRrUkwi7ekcPfCLeQUlxtvevnCmJfxaH0hd+34nuKR8TQf/hiT7W8y91UT06+u0hQxIiK1pDAl0oCN7xbHvRcmUVnl5MYFG/l4Y/JvbwYlwIS3sYa04pFty9kxMZERA+5mdOAinnoabr1FMxaLiNQFhSmRBigywJt/jGnHBW0i+H5PJre+v4mUvGPGM0joDZe9gd1p4sldq1g+LZ4ret/MQP+vuece+Mc/XFe7iIi7UZgSaWDGd4vjrhFt8PTw4MFPt/LaqgM4jz3J1GUqDH+CxMz9PFqcx3szI7mly0x6+a1h9mx47jmXlS4i4pYUpkQaiLhgG4+O7UDv5qGs2pvJnR9u4VB28W8bmD1h6KPQ7Wq67fmOO4OCefV6T/7RdipJ1m1ccQW88Ybr6hcRcVcKUyL1nNnDxJReCdw6pBWVVU7mfLSZBesOH382KiAaxs2HuO6M3rCQ8W078drEFJ5tdg0RpmTGjnHy6acuOwQREbemMCVSj3WIDeQfF7WnfWwg3+xI5+6FW47vGwXQpA9c8iomizezvn+dDgMG8NG47cyNm45HcR4XjHCyerVr6hcRaQwUpkTqIX+rhVuHtOLynglkFDqOnw7mWOfOhoEP4JO5l0f2bqFk9ABWj1zDvKhZZKU6GDLIyc6dZ718EZFGRWFKpJ4Z1TGae0a0IcTPyvzVB3jqq10UOk4YntwaAKOehbYXEbv9C54u92b5ld3x7buYFyPmsGNbFUOHOElJcckhiIg0KgpTIvVEUlQA949MokfTEDYdzmXa/HX8nJz/+w2jO8Ml8yAoju4rX+TBuD68fKU/53d9mdmhz7FsGYwZA3l5Z/8YREQaI4UpERcLslm4tV87xnePJ7e4jDkfbebddYepOtmYmj1nwKCHID+ViUueYGKP8Tw+rpwb2tzNaPtnzJ8P11wD5eVn/TBERBqtmoapocD/AWbgFeDRE96/GbgaqAAygGnAwTqqUcQtWTxMTOgSyXV94vHx9GD+qgM88/Uu8ktOMuOwzQ6jn4fWI7DtWMx9qUeJHzyZx8bm8GTCbLoHbtRgnCIiLlKTMGUGngcGAUeAdcAiYNsx2/wEdAWKgRnA48BldVqpiBsZ2i6S24e0ommYH6v253Dfws3sSS88+cZN+sCYl8Avgvilj/Cv4B5sHzeY1wcf4rXIq4nxPMqECbBgwdk9BhERMdQkTHUH9gD7qp8vAEZzfJhadsz6GmBynVQn4ma6Jti5a3gbOifY2ZlawOz3t/Pdvhxyck4SpMxeMOBu6P03yN7P+YvmcG/Hacwb6YO5x3reCb2eyqJizh8Cq1ad/WMRERFDTcJUDHD4mOdHgB5/sv1VwBd/tVOz2Yzdbq/B15+eoKCgM7bvxkptevqahti4vm8857cMIb3AwQOL9/Dpz+kEBAadtF0rg1tQNOQZKsPbYtvyNn9LS2Zg/xt48KIyLmj1LneGP8ruXSYmTQrgwAEzZ/BXqUHRz2jdU5vWLbVn3asPbVrXHdAnY1zu6/cH70+vXggNDa3jrxapf+Lt3kzvHcewpFCKyyp5bsVB3lqXQmlF1Um3d2LC0XEKJX3uxFRWSNMvbuLv4QOpHHQec0aWcHvsw4wLW8Tnn3syY4YvhYWms3xEIiJyopqEqWQg7pjnsdWvnWggcDdGkHL8wb7+U72QlpbmzMnJqXmlp+lsfEdjozb9a7F2G7PPb8HFnWMoq6zi5W/38vKKfeQWn/w2u5ycHLAnwuhnocl5sOt/DFj3Dg90vZVPB/iyul8WL4ZcS9eQHTz0EDzwQDlOZ+5ZPqqGQz+jdU9tWrfUnnXPlW1akzC1DmgBJGKEqPHAxBO2OQd4GeOuv/S6LFCkIYkLtjGjXzMu6RKH0+lk/uoDvLh8L5mFZX/4GScm6D4dBj4AVRV4LbqBWyxRDB/0MI8MKyGg/Q7etV9LoDmfcePggw/O1tGIiEhN1CRMVQCzgC8x7uybB2wFHgLWY9zZ9wTgB7xf/ZlDwKi6LlakvmoW5sfMAc0Y3TGaSqeTd9cd5vlle0jNL/3Tz1UGJlA86HGI6QG7v6Lp8qd49JybqeycxOzhpYyN+YA7Ip7g8CEnw8bC5s1n6YBERKTGatpnanH1cqz7jlkfWDfliDQsbaMDmNG/GcPbRVFaUcmrqw7w3xX7SC/4oyvd1Tws0Ot68vvPwVRVjunjGUwohRsGPMuH58LX/Yt5KPBWRkavYNEiuOIKjWguIlJfaQR0kdPQv2UY1/RtSu/moeSXlvPC8r3M+34/2UV/fDnvV7HdYOQzENEOzz1fkrD6GW5veiUtWvfirsEFWNvm8Lb/VJrZ05kzBx57DJwnGw1dRETqBYUpkRryMnswulM0V5/XlFaR/qTklfDI4u0s+OEQ+aUnGbX8RN6BcMF90HUa5B+FdyYwymLjlu5P8mNbK7OGljM8ZAn3RjxESUElgwfDN9+c+eMSEZHaUZgS+Qvh/lYm9UxgYvd4wvytbE/J56Z3N/LZ5qOUV9bwlFH7cTD47+AbBmteJGT1S9zd+Ub6tBjE0/3y2d3NyUNeNzK2yUpWrICJEyH5ZPfMiohIvaMwJfIHOsfbmdq7CUPbRWI2mVi2M53XVh1g5e7Mmu8kqiMMexzie0Lyj/D2pYy0xXPH8Lc5mOjDdUOLaBKbzLt+02kSksv99xvz61VWnrnjEhGRuqUwJXIMP6uF0Z2imdA9nnYxgeSXlDN/1QFeX32QQ9nFNd+RTwicfy90mQJFmfDxTCL3fMP9Pe6je5M+/F+3TNb19WSS5RVui3uR9DQnAwbAypVn7thEROTMUJgSATrEBjKxRzyjOkbj42Vh29E87l64hYU/JVNcdgqnicxe0O1q6HcHePnCmhfw+PYJLmsyjL+N/Ih9cZ5cNSQPe4KTFxlFv2b7+fxzT664opzs7DN3fCIicuYoTEmjFezrxehO0YzrEktSdCDFZRUs2nSUd9YeYtORUxyHwGSCtmONDub2JrDna/hyDklVZu674CVaRLblX+eksH5AFMOdH3Bv+BNYTJXcdJMP8+d7kZOj0cxFRBoqhSlpVDzNJga0CueSLrEMaB2Op9mDTYdzuWfhFj7eeJRCRw3uyjtRQm8Y/DDEdIHULfDGGPwPrWN259lc1uoyvo8q4MohOfjF+fFE2aVc2HY7330HU6ZATo617g9SRETOKoUpcXsmE3SJtzOqUzQj2kcR4mclo6CUed/t58MNR9iVVnh6O47qBAPugpZDIO8ILLwO0+b3GJE4jFvGLMJst3Nr98Mc6d2MfsVv8YD9MYL8yrn9dnjqKaiqAru9bo9VRETOPoUpcVutI/0Z3SmakR2jibX7UFJWydfb0/hwQzIrdmdQWXWaI2GGJxkhqs1IKMmBJffD2pfoENSSO4a9TvuwDryZmMynw8oI8bfxWMmFjDxnLz/9BIOmwJYtdXucIiLiWgpT4laSogIY1j6S4e2iaBbuR0VlFSt2Z/LElztZui2NolPpTH6i0BbQ705oNxYcBbDsEVjzIhFmGzf2vJ8Lm13IhoBspvQ7TGm7JozI+Rd3Rc/FZq3izjuNs1EVp3EVUURE6jeFKWnQTCboGBvE4KQIhrWPIjHUl4rKKtbsy2be9/v54ufUmk3x8mciO8B5t0DSKCgvhpVPw+rn8K0oY0rSFKa0nUKxr5mbO+zg8PltiC5N5R5Hfwb0TOfbb+Gaa2D37ro5XhERqX8UpqTBsVo86NUshMFJEVzQJoKIAG/KK6tYtSeTl77dy5JtabUPUABx3eG8W40+UaV5Roha8wKepfmMazmOazteS5AtmH/Hbee7EQl4+zfh6tTruP7c7ygrg2uvhf/+V/PqiYi4O4UpaRAiAqz0bxXOgFbh9GkRip/VQqGjguU701myLY1lO9PJL6mDa2gmE7QcCr1mQZM+xoCbXz8M6/6LqTSfEU1HcH2n64nxj+XdoJ18NKgEmrfn3OSXuDf6eRKTKnjrLbj1VkhNrX05IiJS/ylMSb1k8TBxTnwQ/VqGc37rMJKiAwE4klPMxz8ls2RbGqv3ZlFWWVU3X+hpg44ToddMCGkOuYfgf3fCj/MxlZdwQfwFzOg4g5bBLfnaez+3991FRZe2RKav5racyxl2fgZbt0L//vDtt3VTkoiINAwKU1JvNA315byWYfRpHkqvZiH4WS1UVFax/mAOjyzezrId6exOP81hDP5IYCx0mQpdp4FPsDF/3vtTYfsnmKqqjgtRG0yHmdptI0UXdMWWf4jpe8cyfeB2HA645Rb497/VwVxEpDFSmBKXiQmy0atZiLE0DSE6yAbA/swiFm5IZuXuDFbvzaLgdAbS/DMmEyT2h25XQavhxms7F8Pq5+DQGjxMHgyMH8i1Ha6lZXBLNjoPcVX7teQP7o65KpTR22ZwS9/lBHeBV1+Fe++FlJS6LVFERBoOhSk5a+KCbfRIDKFbk2B6NQ0hPsQHgMxCB2v2ZfH8sj2s2J3B4eySM1OATzB0GG+EqJDmUJQB3z8D61+FvMN4eXgxuuU4prSdQkJAApsrD3F1m1XkDuuByRRDz63/4M6uH9BqTCVLlxr9ojZtOjOliohIw6EwJWeE2cNE60h/Osfb6Z4YTLcmwUQGegOQU1TGDweymfv9flbvzTz9EchrwuQBTQdA58uNs1AWKxxaA8sfhW2fQGUZAV4BXNr+aia3mUyILYTvy3bwYIsV5I/ohckzjnM2PcXNSW/TbXw527fDiBGwePGZK1lERBoWhSmpE8G+XnSMDaJzQhCd4+10igvC12r8eKXklbB2fxbr9mezdn82ezIKz/xwAcFNocNlcM4kCIyD4ixYPxc2vAHp2wBIDExkYuuJjGo2Ch9PHz51rOed9tsoG9wbk0drWv30PDc3e5V+Ex0cPAhTp8Ibb0BlLcb9FBER96MwJafM5mmmbXQAHeOC6BQXRMfYoF8v2VVUVrEtJZ/3fzzChoM5bDiUw5GcM3TZ7kQ+Icbo5B0ug9hu4KyCvcvgq3thx+dQWYYJE31izmNSm0n0jumNo9LBmxWr+KKbDdOAXjgrKmj1w7+Y2ewdhkx2kJoKs2YZ40WV1cHQVSIi4n4UpuRP+XqZaRMVQPvYQLokhtEm0o8mwTbMHibAGKpg0+E83lx7kE2Hc9l8JI+S8rN46sY7EFoNg7ZjofkF4GGB1M1GgPr5A8g/CkCIdwij24zm4hYXEx8QT0pJGvebP2fTwDi8ug3CWVhAh5X3Mav9IvpeVUFGBtxxBzz3HBQXn73DERGRhkdhSn4VFehN68gAkqIDSIoyHhNDfX99P6OgjG1phXy68QhbkvPYfDiPjELH2S/UO9Do/9T2Imh2Ppi9IO8wrHoWNr/362U8EyZ6RZ/LxS0uZkD8ADw9PFmVt5G/B28iY3g3PONGY04+TJcl1zO713K6X1tFcjLceKNxJkohSkREakJhqhEKsFloEe5Pqwh/Wkf50yrSn9aRAQTaPH/d5kBmEdtS8vlwwxG2Hc1nS3IeFRbjUl5OTo4Lio42AlSr4ZB4nhGgcg/B2pdh60JjfKhq8f7xjGw2kgubXkisfyw5pTm8UPI/vu1sxTSkH2bfrnhu/I4RO2dx7ZCdND8f9u6F6dNh/nxdzhMRkVOjMOXGQny9aBbuR7MwX1qE+9Miwo+WEf5EBHj/uk1BaTk7Uwv4bNNRtqcWsDM1n+0pBRSeZGwnu93n7BVvMhkTDLccAq1GQHQn4/WsPbDmJdi2EJI3/Lp5gFcAQ5oMYVSzUXQK70SVs4qVWev4e/gajo5sj3e7MXiUlOD33TtM9JnHtLFZBAXB6tVw113w0UfqWC4iIqdHYaqBs1o8SAjxITHUj6ahviSG+dI01Jfm4X4E+Xj9ul1xWQW70wpZuTuD3WmF7EorZHd6wdnrHF4TNrtx2a75BdB8IPhFGJ3ID/8AS+6HnZ9D5u5fN/f19KV/bH+GNBlC75jeeJm92Jm7mweK32dDlwA8B/bD7Ncb064dtP1kBpOTvuPCGUZI/OAD+Ne/YO1aVx2siIi4C4WpBsDHy0yc3YcmoT6JW4RSAAASeklEQVQkhPjSJMR4TAjxITrQhkd1Z3CAtPxS9mcW8dnmFPZmFLI3vZC9GUUczSs588MRnCqLFeJ6QGI/aNoPojuDhxmKs2Hv17BnKez52hhcs5qvpy99Y/sypMkQ+sT0wWq2klqUytycz/mmrZPyy8/FK3YCnkVFWFd+wGjTfKZemELTkZCeDk88AS++CIcOufC4RUTErShM1QOeZhNRgTZi7TZi7T7E2m3EB/sQH+xDXLAPYf7W47bPKnRwMKuYdQdy2J95mP0ZRezLLOJAZhFFZfX4WpXZC6LPgYTekNgX4nsaEwxXVRh9nlY8AXuWGJfvnL9NYBxmC6N/XH/Ojz+f7pHd8TJ7kVacxmuZn7O8RRmFIzpg6zAOqqpwrllBpzVzGNd+AyNmVOHlBcuWwZw58PHH6g8lIiJ1T2HqLAiwWYgOtBEVaCMmyJsYu43oIGOJCbIRGeB93NmlisoqjuaWcii7mCXb0jicXczhnGIOZBVxKKuY/NIGMpuulx/EdIGEXkaAiu1mhCeAtK3w46uwbzkcXAWOgl8/ZsJEUkhbzos5j75xfWkf2h6Ag/kHmZvxCSubl1MwrAO2TpcaH9iymch372Bs9BLGX1RCaCikphoTD7/yCuzceZaPW0REGhWFqVowmSDYx4vIQG8iAryJqn6MDDTWowJtRAV6/zoS+C/KKqpIySvhaG4pq/dmcTinmCM5JRypfkzJK6Wyqr5dk6uB4KYQ1x1iu0NcNwhva1y2q6qE1C2wfp4RnA6tNkYkP/aj3sGcG30uvaN7c27MuQR7B1PlrGJL5s/8I/sdfmzpQcXoc/BOmgCAadtWgt+5m+H2pVw8NJ9Wl0BpKXzyiXFH3ldfqUO5iIicHQpTJ2HxMBHi50WYv5Vwf2/C/a2/rQdYifC3Eh7gTZi/FU+zx3GfraxyklHgIDWvhF1pBXy7K52UvFJScktJySvhSE4JGYWO+td/6VT5R0FMZ6OfU0xn4/KdzW6858iHI+uNy3ZHfoDD64zXjuHn6UfXyK50j+xOz6ietLC3ACC7NJtvM3/gm7B09rcJwnNKTzxjOmOuqqJsw48Ev3Ung+3LuWRIHkljjMC0bBk89RS8/z7k5p7thhARkcau0YQpP6uFYF8vQny9CPHzIsTPSoivEZhCfL0I9bcS5mcl1M+K3dfrpPvILiojo8BBWn4pu9MzScs31tMLSknNKyU1v5TMwrKGeVbpj5g8IDgRIjtSnNidyrC2ENoGfMOM96sqIG2bMWlw8gY4sg4ydhzX5wnAbrVzTsQ5dAnvQueIzrQJboPZw0xpRSkbMn7ivawf2JzoQeGAFvh0HozJywvvoiIca7+jzbf3c0HUOkYOdtB0ElRVwYoV8OyzxpAG6ekuaBcREZFqbhumusUHcNOAJgR6mwnx9cLqaT7pdvml5WQXlpFR6GBPRiGr92WRWeggs8B4LT2/lPQCB5mFDsor3SgknYx/JIS1gYgkCE+CiLYQ1go8jfGlHJVlmLN2wc7/QeomOPoTpP4MFaXH7cbD5EHToOZ0COtA+9D2dA7vTNOgptX7cLA5YwvPZH/IT3HlZCfF4N29K5ag8wAw79iB58Ln6e2xhP6tDjB4vBO7HUpKYOlS+Oc/4dNPIS3trLaMiIjIH3LbMFVcXkV6YRlbjhSRXVhGVlEZ2UUOsorKyCx0kFVYRnZRGY6Kqr/emTvxsIA9AUKaQ2hLIyyFtoKwluAd9Nt2hWnGGaf184zH1M0Eladhqir/3QjosX6xtAlpQ1JIEu1D29MutB2+nsY0NHmOPH7M2sSb5nVsj3GS1yoK73M6YQnpCYBXcjLOlYtpXbiE8yI2Mei8EtqNNvabkmLcgffJJ7BkiaZ3ERGR+sltw9TWlEJu/HCHa6Y+cTUPCwTFgz3RuEQXnAjBzYwAZW8C5t+mjaEwDTJ2wub3IXOnsZ629XcdxAE8g8OID2hKlD2KlvaWRoAKTiLAGgBAeVU5O7N3sSB/GRtDCzkSZ6O8VQLe7c7Fw9sYdd3rwEGca5bQpngpPe2bOK9LIV1vBIsFHA5YudLoQP7ll7Bly9loLBERkdpx2zDl1jzMRgfwwFgjNAUlGIs9wXgeGGsEql+UF0P2PiMkbfvEmJLll6Xk92HTbDITG5BAs8BmNA1qSrPAZrS0t6RpUFMs1fstqyxjV+5uPij5nq22Yg5HWShOjMCrXVss9o7GfhwOyrdvI2jJC3RyruKcsL30PKeUdgPBbDbGfPrhB3j0UVi+3JjaRWefRESkoVGYqm88zMY0Kv5REBBjTPD7yxIYayz+0cZ2xypIhdyDRgfwLe8b4Sl7v/FYePIORnarnYSwTiQEJPy6JAYmkhCQgJf5t074KYUpbCzfz+eWg+wPqSQ52ExZQgRerVth9jWCk7O8HI99ewla/yGty1bTzm8nnRKz6TLQSUiIsZ+8PFizBhYuhO++g1WrjL5QIiIiDZnC1NniHQi+oeAbboQlv/DqJRL8I6ofI41tTMcPt0CFAwpSIPcQ7F8JeUeMJf+I8Vru4d91Agewmq1E+0YTFX0uMX4xxPrHEusXS5x/HLH+sfh7+f+6bXlVOQeLjrDFM50PrAc4HFxFZpiV0uhgLE2bYAnu+9uOc3Px3vczTdY+R3PnZlr576dtXC4dejsJGVW9v3L4+WcjOK1da5x12raNhj8khIiIyAkUpk6Hp80YU8kWbDz6BINPyDGPIeATagwf4BtiPJpPMtxCVYUx71xBGuQnw9ENxhmmwurn+UeNx+Ls35fg4UmYLYxwn3AiY/sT4RtBhI+xRPlFEe0bTYgt5LjPOCrL2OVMZatXNp/5bCIloJLMYAuF4f5URYfhGZWIydLi1+0rsjIJSdlIzK5vSKzaSquAozQPzaR5QjFNevy238JCo3/Thx/CTz/B+vXGc4ejzlpcRESk3mqcYcrsBVZ/42yR1R+sAeAdYDw/bgkCW9AJj/bfpkQ5mdI8I/yUZBtBKGWTEZiKM43HwnQjLBWmG9scc6rG4mHBbrVj97YTYgshxCeBkJDOhHiHEOwdTJhPGGE2Ywk69s47wAmkWYrZa8lis1cBX/gcJM13H7mBHhQFeVMeFogpMhwPn6ZA09++Mz+V+KwNROQvIzp7LzGeR0jwTycxooDmHarwO/e37yguhj17zKxaBfPmGYFp82bYv19nnEREpPFy2zBVEdWZkm6zwMMbrH5GYPLyM9Yt3n+9A0c+lORCaa7xmLmnej3HWIqzq9erH4syjfXKcswmM/5e/gR4BRBgDTAeq9eD/FoSFNKdQGsgQdYgAq2BvwaoYy+7AZSbocAGWdYyks0FHPQs4gergyxbCnk+KRT6mSkJ9KbC7gchdkyeAUBA9aedBJpyCC7YTfPCnwl1HCA87RARllSibNlEBhYSF+EgvNXxKcjhgH37YM8eWLYU9u411nfsgIKCIJxOU+O8Q1JEROQP1DRMDQX+DzADrwCPnvC+FXgd6AJkAZcBB+qmxNPj9PDE6RMKxblG/yJHATgKoawQSvPBkVf9WIDJUYB3eQm28jJ8KsuxVVViM3vj4+mDj8UHH08fbBYbvp6+vy3eTfHz98PX0xc/Tz/8vPzw9/LHz9MPn+pBLqtMUOoFxV7Vj95QbDWRbXGQZS5hh2cZeZ4V5FkrKfTOpdhWQKmPhXI/K5X+PuD7yxkwC14mMwEeJoLMFQSa8okqTsa/LJWg8qPYnenYS7IIrswlxFZIWEAJEcHleJ3kymJWFiQnw5FD8OMqOHDgt+XgQWNspz86y2S3m07+hoiISCNWkzBlBp4HBgFHgHXAImDbMdtcBeQAzYHxwGMYgcpl2hbmcMnONXhUemA1W7FarHibw7BaY/Hy88bTyxuztw2z1Ruz1ZtyC5RZoNxinBEqs5go8zReK7OAo3q91BMKzeXkmCsoNldSbKmi1NNJqReUepkoszqpsJaCzYTVpxJvUyk2jxK8PUrxNpXg61GMj0cxNlMJwR7FxDjz8S3PxlaZg29VHr7k42cqxN9SSIBnMQHepQT6lGGz/vHgosXFkJFhLGlHYVMqpJ6wpKTAkSO6e05ERKSu1SRMdQf2APuqny8ARnN8mBoNPFC9/gHwHGDC6MrjElGD25J9oxdOj0pM5hIwF2IyV2IyOzGbKzGbKrBQicVUUb1egaepAssvC+XYTOUEmMrxMpXhaSrH85d1ZylezlK8cBiLyYHVw4G3RxneljKs5grMHqd26Pn5xlJQYDxm5cK+PGPi3txcY1iBrCzIzj5+ycjQ2EwiIiKuVJMwFQMcPub5EaDHn2xTAeQBIUDmH+3UbDZjt9trXukpiojawCNt5p3y58rKTVRUmCivMFFWbqLMYaKsDMrLoLzMicPhpMwBhQ4TDgc4qt8vLTVRUmKitNSD0lIrpaVQUmKiuNhEcbGxXlJiorDQRFERFBebKCoy3i8sBKfz9C6hWa3GcjYEBQX99UZyStSmdUvtWffUpnVL7Vn36kObnu0O6NOrF0JDQ8/oF61emM3IH6PJySmgstJERQVUVhpLRYWJ8nKqXzPe++W5cUJNREREpGZqEqaSgbhjnsdWv3aybY5U7zMQoyP6if5TvZCWluY803eFHT4MOTkFZ/Q7GiPdzVf31KZ1S+1Z99SmdUvtWfdc2aYef70J64AWQCLghdHBfNEJ2ywCplSvXwJ8gwv7S4mIiIicLTU5M1UBzAK+xLizbx6wFXgIWI8RpOYCb2B0VM/GCFwiIiIibq+mfaYWVy/Huu+Y9VJgXJ1UJCIiItKA1OQyn4iIiIj8AYUpERERkVpQmBIRERGpBYUpERERkVpQmBIRERGpBYUpERERkVpQmBIRERGpBZPT6bKByjOAg2f4O0L5k8mW5bSoTeue2rRuqT3rntq0bqk9697ZaNMEIOxkb7gyTJ0N64Guri7CzahN657atG6pPeue2rRuqT3rnkvbVJf5RERERGpBYUpERESkFtw9TP3H1QW4IbVp3VOb1i21Z91Tm9YttWfdc2mbunufKREREZEzyt3PTImIiIicUY0hTD0MbAY2Al8B0a4txy08AezAaNeFQJBry2nwxgFbgSp0h09tDQV2AnuAO11cizuYB6QDP7u6EDcRBywDtmH8zt/g2nIaPG/gB2ATRns+6KpCGsNlvgAgv3r9b0AScJ3rynELg4FvgArgserX7nBdOQ1eG4wg9TJwK8YtvnLqzMAuYBBwBFgHTMD4wyWnpy9QCLwOtHNxLe4gqnrZAPgDPwIXoZ/R02UCfDF+Rj2B7zAC6pqzXUhjODOVf8y6L+D26fEs+AojSIHxQxvrwlrcwXaMsylSO90xzkjtA8qABcBol1bU8K0Asl1dhBtJwQhSAAUYv/sxriunwXNiBCkwwpQnLvob3xjCFMA/gMPAJOA+F9fibqYBX7i6CBGMP0qHj3l+BP2hkvqrCXAOsNbFdTR0ZoxuPOnAElzUnu4SppZiXNM/cfnlf6V3Y1yrfguY5YoCG6C/alMw2rUCo13lz9WkPUWkcfADPgRu5PirJ3LqKoFOGFdIuuOiy9EWV3zpGTCwhtu9BSwG7j+DtbiLv2rTK4ELgQvQpdOaqOnPqJy+ZIz/NP0itvo1kfrEEyNIvQV85OJa3EkuRuf+objghgl3OTP1Z1ocsz4a4y40qZ2hwO3AKKDYxbWI/GIdxu97IuAFjAcWubQikeOZgLkYfaWednEt7iCM3+4mt2HcfOKSv/GN4W6+D4FWGHdLHcS4k0//W62dPYAVyKp+vgbdIVkbY4BnMf5hyMW4/j/EpRU1XMOBZzD6UczD6C8pp+8doD8QCqRhnNWf68qCGrg+wEpgC8bfJIC7MK6YyKnrAMzH+H33AN4DHnJFIY0hTImIiIicMY3hMp+IiIjIGaMwJSIiIlILClMiIiIitaAwJSIiIlILClMiIiIitaAwJSIiIlILClMi0tD5AQcw5t78hT9wCLjEFQWJSOOicaZExB0MAd4EkoAM4EUgAhjryqJEpHFQmBIRd/Eaxsj8L2PMfNAWSHVlQSLSOChMiYi7sAPbMCaSvQ141bXliEhjoT5TIuIucoCtgA/wkYtrEZFGRGFKRNzFZKAJsBR4zLWliEhjost8IuIOwjHOSl0K7KheHw2sdGVRItI4KEyJiDt4D8gDrql+fjVwK9ARcLiqKBFpHBSmRKShuwh4AWNYhNxjXv8GWA3c7YqiRKTxUJgSERERqQV1QBcRERGpBYUpERERkVpQmBIRERGpBYUpERERkVpQmBIRERGpBYUpERERkVpQmBIRERGpBYUpERERkVpQmBIRERGphf8HRq9H7QGIM/cAAAAASUVORK5CYII=\n",
1205
      "text/plain": [
1206
       "<Figure size 720x360 with 1 Axes>"
1207
      ]
1208
     },
1209
     "metadata": {
1210
      "needs_background": "dark"
1211
     },
1212
     "output_type": "display_data"
1213
    }
1214
   ],
1215
   "source": [
1216
    "df_array = [2, 5, 10, 20]\n",
1217
    "x = numpy.linspace(-3, 3, 100)\n",
1218
    "\n",
1219
    "pyplot.figure(figsize=(10, 5))\n",
1220
    "pyplot.title(f'CDF распределений T и N', fontsize=12)\n",
1221
    "for df in df_array:\n",
1222
    "    t_dist = t(df=df)\n",
1223
    "    pyplot.plot(x, t_dist.cdf(x), label=f't(df={df})')\n",
1224
    "\n",
1225
    "z_dist = norm(loc=0, scale=1)\n",
1226
    "pyplot.plot(x, z_dist.cdf(x), c='yellow', label='N(0, 1)')\n",
1227
    "pyplot.legend(fontsize=12)\n",
1228
    "pyplot.xlabel('X', fontsize=12)\n",
1229
    "pyplot.grid(linewidth=0.2)\n",
1230
    "pyplot.show()"
1231
   ]
1232
  },
1233
  {
1234
   "cell_type": "markdown",
1235
   "id": "898b822a",
1236
   "metadata": {},
1237
   "source": [
1238
    "Как видно на графике, чем меньше степень свободы, тем выше линия на графике (при x < 0), а значит и больше cdf при фиксированном x. Поэтому и p-value будет больше.\n",
1239
    "\n",
1240
    "\n",
1241
    "- Распределение Стьюдента с бесконечностью степеней свободы &mdash; это нормальное распределение: $t_{\\infty} = \\mathcal{N}(0, 1)$. Поэтому `norm(0, 1).cdf(x) = t_distr(df=infinity).cdf(x) < t_distr(df=N).cdf(x)`.\n",
1242
    "\n",
1243
    "Поэтому, если выборка небольшая, безопаснее использовать t-test. Но все еще не факт, что ваш критерий будет валиден!\n",
1244
    "\n",
1245
    "---\n",
1246
    "\n",
1247
    "Посмотрим еще раз на табличку \n",
1248
    "\n",
1249
    "|                          | маленькая выборка | большая выборка |\n",
1250
    "|--------------------------|-------------------|-----------------|\n",
1251
    "| нормальное распределение | t-test            | t-test, t'-test |\n",
1252
    "| любое распределение      |                   | t'-test, t-test |\n",
1253
    "\n",
1254
    "Мы видим, что мы везде можем использовать t-test (а t'-test не всегда), и в случае маленьких выборок он безопаснее. **Поэтому t-test и стал намного более популярным, чем t'-test**. Но t'-test на практике может быть тоже полезен: \n",
1255
    "- Не надо думать при реализации о степенях свободы.\n",
1256
    "- Написать такой критерий на SQL будет сильно проще: вы можете использовать табличные значения в коде, чтобы понять, отвергся ли критерий.\n",
1257
    "- Делать различные теоретические вычисления проще. \n",
1258
    "- В нем сложнее ошибиться при реализации.\n",
1259
    "\n"
1260
   ]
1261
  },
1262
  {
1263
   "cell_type": "markdown",
1264
   "id": "a4d0890b",
1265
   "metadata": {},
1266
   "source": [
1267
    "## MDE\n",
1268
    "\n",
1269
    "Вернемся к задаче со стартапом. Представим, что мы хотим запустить наш стартап в новом городе, например в Санкт-Петербуре. **Вопрос: можем ли мы собрать выборку не из 2000 людей, как мы делали с Москвой, а всего из 1000?**\n",
1270
    "\n",
1271
    "Что вообще нам мешает взять слишком маленькую выборку?\n",
1272
    "- Например, если мы проверяем наш стартап на 1-2 пользователей, то мы ничего не можем сказать про наш истинный эффект, он может быть как больше 0, так и меньше. Будет слишком широкий доверительный интервал (из-за большой дисперсии в выборке, как мы видели в Москве), и нам нужен огромный эффект, чтобы его обнаружить: например, 1М рублей прибыли.\n",
1273
    "    - Еще, возможно, мы не можем использовать критерий на такой маленькой выборке, но сейчас посчитаем, что t-test критерий валиден даже на маленькой выборке.\n",
1274
    "- А если выборка состояла бы из бесконечного числа пользователей, то мы могли бы абсолютно точно сказать истинную прибыль от пользователя, даже если она равна 1 копейке.\n",
1275
    "- Но оба эти случая нас не устраивают :( В первом - мы не сможем запустить стартап из-за слишком большого шума, а во втором - нам нужна вечность, чтобы проверить нашу гипотезу.\n",
1276
    "\n",
1277
    "И здесь нам поможет MDE (minimum detectable effect). Это такое истинное значение эффекта, что наш шанс его обнаружить равен $1-\\beta$ при использовании нашего критерия.\n",
1278
    "   - Мы можем посмотреть, какой эффект мы сможем задетектировать при доставке 1000 пользователям, и от этого решить, подходит нам такая выборка, или нет. Например:\n",
1279
    "        - Мы видим, что MDE 100 рублей. То есть с вероятностью $1-\\beta$ (на практике 80%) мы его обнаружим, **если такой эффект будет**. И с вероятностью 80% стартап запустится в Питере. Отлично, это нас устраивает, мы проверяем гипотезу на 1000 человек.\n",
1280
    "        - Мы видим, что MDE 10000 рублей. Это, наоборот, слишком много: у нас 99% товаров стоят меньше 1000 рублей. Мы не наберем такой прибыли, стартап невыигрышный, нужно брать выборку большего размера.\n",
1281
    "\n",
1282
    "---\n",
1283
    "\n",
1284
    "\n",
1285
    "От чего зависит MDE?\n",
1286
    "- Ошибка 1 рода, или $\\alpha$.\n",
1287
    "    - Например, при $\\alpha = 1$ мы найдем эффект и при размере выборки, равной 1 (мы просто всегда будем отвергать 0 гипотезу). А при $\\alpha = 0$ мы никогда не задетектируем эффект.\n",
1288
    "- Мощность, или $1 - \\beta$.\n",
1289
    "    - Следует из самого определения\n",
1290
    "- От шума в данных, или от дисперсии.\n",
1291
    "    - Чем более шумные данные, как мы знаем, тем шире доверительный интервал. А значит сложнее точно предсказать рамки для истинного эффекта, поэтому и MDE будет больше.\n",
1292
    "- От размера выборки.\n",
1293
    "    - Нас интересует не просто дисперсия в данных, а дисперсия среднего значения: она по той же логике должна быть как можно меньше. А что такое дисперсия среднего? Это $\\dfrac{\\sigma^2}{N}$, поэтому MDE также зависит от размера выборки.\n",
1294
    "\n",
1295
    "\n",
1296
    "\n",
1297
    "Теперь давайте выведем формулу исходя из того, что мы знаем все эти 4 параметра.\n"
1298
   ]
1299
  },
1300
  {
1301
   "cell_type": "markdown",
1302
   "id": "7758b93d",
1303
   "metadata": {},
1304
   "source": [
1305
    "-----\n",
1306
    "Для начала определимся с проверяемой гипотезой:  \n",
1307
    "- $H_0: \\mu_0 = 0\\ vs. \\ H_1: \\mu_0 > 0$\n",
1308
    "\n",
1309
    "Обозначим \n",
1310
    "- $S^2_{\\mu} := \\dfrac{S^2}{N}$ &mdash; оценка дисперсии среднего значения.\n",
1311
    "- $S_{\\mu} = \\sqrt{\\dfrac{S^2}{N}}$ &mdash; оценка стандартного отклонения среднего значения, или SEM.\n",
1312
    "\n",
1313
    "Теперь, мы знаем, что \n",
1314
    "- $\\overline X \\sim \\mathcal{N}(\\mu, S^2_{\\mu})$\n",
1315
    "\n",
1316
    "Нам надо найти $MDE=m$, такое, что:\n",
1317
    "\n",
1318
    "- если $\\overline X \\sim \\mathcal{N}(m, S^2_{\\mu})$, то в $1-\\beta$ проценте случаев для него отвергнется критерий. Проверяем мощность (зеленая площадь на графике).\n",
1319
    "- если $\\overline X \\sim \\mathcal{N}(0, S^2_{\\mu})$, то критерий отвергнется для него в $\\alpha$ процентов случаев. Проверяем FPR (красная площадь на графике).\n",
1320
    "\n",
1321
    "\n",
1322
    "<img src=\"https://raw.githubusercontent.com/dimalunin2016/pictures/main/download-3.png\" width=\"1500\" height=\"200\" />\n"
1323
   ]
1324
  },
1325
  {
1326
   "cell_type": "markdown",
1327
   "id": "25db6829",
1328
   "metadata": {},
1329
   "source": [
1330
    "\n",
1331
    "То есть:\n",
1332
    "\n",
1333
    "- Пусть $B(X): P_{H_0}(\\overline X > B(X)) = \\alpha$. $B(X)$ &mdash; Граница критической области, красная граница на графике.\n",
1334
    "- Тогда $P_{H_1}(\\overline X > B(X)) = 1-\\beta$. Зеленая область на графике. \n",
1335
    "    - Или, что аналогично: $P_{H_1}(\\overline X - m > B(X) - m) = 1-\\beta$.\n",
1336
    "    - Обозначим $\\xi := \\overline X - m$. $P_{H_0}(\\xi > B(X) - m) = 1-\\beta$. Рыжая плотность получается из синей вычитанием m. $\\xi$ из рыжей плотности, $\\overline X$ из синей.\n",
1337
    "\n",
1338
    "Надо решить эти 2 уравнения и мы получим выражение $m$ через все 4 параметра.\n",
1339
    "\n",
1340
    "1. $B(X)$ мы итак знаем. При $H_0$ наш критерий имеет следующий вид: $\\left\\{T(X) \\geq z_{1 - \\alpha} \\right\\} \\Leftrightarrow  \\left\\{\\sqrt{N}\\dfrac{\\overline X}{\\sqrt{S^2}} \\geq z_{1 - \\alpha} \\right\\} \\Leftrightarrow B(X) = z_{1 - \\alpha}\\sqrt{\\dfrac{S^2}{N}} = z_{1 - \\alpha}S_{\\mu} $\n",
1341
    "\n",
1342
    "2. $P_{H_0}(\\xi > z_{1 - \\alpha}S_{\\mu} - m) = 1-\\beta$. Работать с распределением $\\mathcal{N}(0, S^2_{\\mu})$ не очень удобно, гораздо проще с $\\mathcal{N}(0, 1)$. Для этого перехода достаточно перейти от $\\xi \\rightarrow \\dfrac{\\xi}{S_{\\mu}}$ по свойствам нормального распределения.\n",
1343
    "\n",
1344
    "- Обозначим $\\eta := \\dfrac{\\xi}{S_{\\mu}}$. Тогда \n",
1345
    "$$\\begin{align}\n",
1346
    "    &P_{H_0}(\\xi > z_{1 - \\alpha}S_{\\mu} - m) =\\\\ \n",
1347
    "    &P_{H_0}(\\dfrac{\\xi}{S_{\\mu}} > \\dfrac{z_{1 - \\alpha}S_{\\mu} - m}{S_{\\mu}}) =\\\\\n",
1348
    "    & P_{\\mathcal{N}(0, 1)}(\\eta > z_{1 - \\alpha} - \\dfrac{m}{S_{\\mu}}) = 1-\\beta\n",
1349
    "\\end{align}\n",
1350
    "$$\n",
1351
    "- $\\Phi(C) = P(\\eta < C)$. Тогда \n",
1352
    "    $$\\begin{align}\n",
1353
    "    &1 - \\Phi \\left(z_{1 - \\alpha} - \\dfrac{m}{S_{\\mu}} \\right) = 1-\\beta \\Leftrightarrow\\\\ &z_{1 - \\alpha} - \\dfrac{m}{S_{\\mu}} = z_{\\beta},\n",
1354
    "    \\end{align}\n",
1355
    "    $$ \n",
1356
    "    где $z_{\\beta} = \\Phi^{-1}(\\beta)$ &mdash; квантиль $\\beta$ нормального распределения.\n",
1357
    "    - В конце мы как раз пользуемся тем, что $\\eta \\sim \\mathcal{N}(0, 1)$.\n",
1358
    "- Финально мы получаем, что: $m = (z_{1 - \\alpha} - z_{\\beta}) \\cdot S_{\\mu} = |\\text{расп. симметрично}| = (z_{1 - \\alpha} + z_{1 - \\beta}) \\cdot \\sqrt{\\dfrac{S^2}{N}}$.\n",
1359
    "\n",
1360
    "### Итого:\n",
1361
    "\n",
1362
    "- $\\text{MDE} = (z_{1 - \\alpha} + z_{1 - \\beta}) \\cdot \\sqrt{\\dfrac{S^2}{N}}$"
1363
   ]
1364
  },
1365
  {
1366
   "cell_type": "markdown",
1367
   "id": "612b4ad9",
1368
   "metadata": {},
1369
   "source": [
1370
    "----\n",
1371
    "\n",
1372
    "\n",
1373
    "Вернемся к стартапу. Мы определились, что N = 1000, $\\alpha=5$%, $1-\\beta=80$%, а как узнать $S^2$? \n",
1374
    "\n",
1375
    "На практике есть 3 способа: \n",
1376
    "- Оценить на исторических данных. В данном случае это не подходит, потому что ранее стартапа в Питере не было.\n",
1377
    "- Оценить по похожим данным. Например, в нашем случае, оценить дисперисию по Москве.\n",
1378
    "- Как-то теоретически оценить. Самый плохой способ, который работает, если первые 2 не помогают.\n",
1379
    "\n",
1380
    "\n",
1381
    "Посмотрим теперь MDE в нашей задаче."
1382
   ]
1383
  },
1384
  {
1385
   "cell_type": "code",
1386
   "execution_count": 25,
1387
   "id": "deca8d22",
1388
   "metadata": {},
1389
   "outputs": [
1390
    {
1391
     "name": "stdout",
1392
     "output_type": "stream",
1393
     "text": [
1394
      "MDE при N=1000: 126.08268390090282\n"
1395
     ]
1396
    }
1397
   ],
1398
   "source": [
1399
    "N = 1000\n",
1400
    "S2 = numpy.var(profits)\n",
1401
    "alpha = 0.05\n",
1402
    "beta = 1 - 0.8\n",
1403
    "\n",
1404
    "MDE = (norm().ppf(1-alpha) + norm().ppf(1 - beta)) * numpy.sqrt(S2/N)\n",
1405
    "print(f\"MDE при N={N}: {MDE}\")"
1406
   ]
1407
  },
1408
  {
1409
   "cell_type": "markdown",
1410
   "id": "c9f9d9c2",
1411
   "metadata": {},
1412
   "source": [
1413
    "А значит мы можем рассчитывать на точность лишь в 126 руб.\n",
1414
    "\n",
1415
    "----\n",
1416
    "Для нас это слишком большой MDE: хочется, чтобы он был $\\leq$ 100 рублей, мы предполагаем, что это более вероятный истинный эффект, исходя из опыта с Москвой.\n",
1417
    "\n",
1418
    "\n",
1419
    "Давайте теперь решим обратную задачу: Мы знаем MDE=100руб, $\\alpha=5$%, $1-\\beta=80$%, $S^2$, чему равно $N$? Выведем его из формулы MDE:\n",
1420
    "\n",
1421
    "$N = \\left(\\dfrac{z_{1 - \\alpha} + z_{1 - \\beta}}{\\text{MDE}}\\right)^2 S^2$"
1422
   ]
1423
  },
1424
  {
1425
   "cell_type": "code",
1426
   "execution_count": 26,
1427
   "id": "4691e976",
1428
   "metadata": {},
1429
   "outputs": [
1430
    {
1431
     "name": "stdout",
1432
     "output_type": "stream",
1433
     "text": [
1434
      "Минимальный размер выборки: 1590\n"
1435
     ]
1436
    }
1437
   ],
1438
   "source": [
1439
    "S2 = numpy.var(profits)\n",
1440
    "alpha = 0.05\n",
1441
    "beta = 1 - 0.8\n",
1442
    "mde = 100\n",
1443
    "\n",
1444
    "N = ((norm().ppf(1-alpha) + norm().ppf(1 - beta)) / mde)**2 * S2\n",
1445
    "N = int(N) + 1\n",
1446
    "print(f'Минимальный размер выборки: {N}')"
1447
   ]
1448
  },
1449
  {
1450
   "cell_type": "markdown",
1451
   "id": "1d44cacc",
1452
   "metadata": {},
1453
   "source": [
1454
    "Тогда нам надо взять выборку размера примерно 1600 человек. \n",
1455
    "\n",
1456
    "Таким образом, сделав подготовительную работу, мы поняли, что 1000 человек это мало, 2000 человек &mdash; много для нашего MDE. И подобрали иделаьный размер выборки."
1457
   ]
1458
  },
1459
  {
1460
   "cell_type": "markdown",
1461
   "id": "5b24961a",
1462
   "metadata": {},
1463
   "source": [
1464
    "# Двувыборочный T-test. Задача AB-тестирования\n",
1465
    "\n",
1466
    "> 📈 **Задача**\n",
1467
    ">\n",
1468
    "> У нас на сайте Авито есть услуги продвижения. Мы хотим начать давать на них скидки, чтобы привлечь больше людей и начать больше зарабатывать. Для этого было решено провести AB тест:\n",
1469
    "> Одной половине пользователей мы не выдали скидок, а во второй половине мы выдали скидки всем новым пользователям. Надо понять, стали ли мы больше зарабатывать?\n",
1470
    "\n",
1471
    "\n",
1472
    "Для решения этой задачи мы не можем использовать одновыборочный t-test. В этот раз у нас 2 выборки $A$ &mdash; контроль, и $B$ &mdash; тест.\n",
1473
    "\n",
1474
    "Наша гипотеза звучит так: \n",
1475
    "$H_0: E A = E B\\ vs. H_1: E A < E B$\n",
1476
    "\n",
1477
    "1. **Обе выборки нормальны**. Тогда есть 2 критерия в зависимости от наших знаний про дисперсию:\n",
1478
    "    - $\\sigma^2_A = \\sigma^2_B$. \n",
1479
    "    \n",
1480
    "    Тогда:\n",
1481
    "        - $S^2_{full} = \\dfrac{(N - 1)S^2_A + (M - 1)S^2_B}{N + M - 2}$, где N, M -  размер контроля и теста соотвественно. А критерий выглядит следующим образом:\n",
1482
    "        - $T(A, B) = \\dfrac{\\overline A - \\overline B}{S^2_{full}\\sqrt{1/N + 1/M}} \\overset{H_0}{\\sim} T_{n + m - 2}$\n",
1483
    "   \n",
1484
    "    - $\\sigma^2_A \\neq \\sigma^2_B$. \n",
1485
    "    \n",
1486
    "    Тогда:\n",
1487
    "        - $T(A, B) = \\dfrac{\\overline A - \\overline B}{\\sqrt{S^2_{A}/N + S^2_{B}/M}} \\overset{H_0}{\\sim} T_{v}$\n",
1488
    "            - где $v = \\dfrac{\\left(\\dfrac{S^2_{A}}{N} + \\dfrac{S^2_{B}}{M} \\right)^2}{\\left(\\dfrac{(S^2_{A})^2}{N^2(N - 1)} + \\dfrac{(S^2_{B})^2}{M^2(M-1)} \\right)} $\n",
1489
    "2. **Хотя бы 1 выборка ненормальна**. Тогда вбой вступает нормальная аппроксимация при большом размере выборок, критерий T'-test:\n",
1490
    "    - $T(A, B) = \\dfrac{\\overline A - \\overline B}{\\sqrt{S^2_{A}/N + S^2_{B}/M}} \\overset{H_0}{\\sim} \\mathcal{N}(0, 1)$\n",
1491
    "    - Согласитесь, здесь намного проще формула, чем те, что выше? :) Поэтому для AB-тестирования самостоятельно легче реализовать именно t'-критерий, где вы не ошибетесь.\n",
1492
    "    \n",
1493
    "    \n",
1494
    "-----\n",
1495
    "\n",
1496
    "Python-библиотеки:\n",
1497
    "\n",
1498
    "- `scipy.stats.ttest_ind` &mdash; 2-выборочный t-test [критерий](https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.ttest_ind.html#scipy.stats.ttest_ind)\n",
1499
    "- `CompareMeans` &mdash; [класс](https://www.statsmodels.org/stable/generated/statsmodels.stats.weightstats.CompareMeans.html) для построения доверительных интервалов у t-test."
1500
   ]
1501
  },
1502
  {
1503
   "cell_type": "code",
1504
   "execution_count": 27,
1505
   "id": "bfbf5c89",
1506
   "metadata": {},
1507
   "outputs": [
1508
    {
1509
     "data": {
1510
      "text/plain": [
1511
       "Ttest_indResult(statistic=2.5645688722251325, pvalue=0.005237676356845092)"
1512
      ]
1513
     },
1514
     "execution_count": 27,
1515
     "metadata": {},
1516
     "output_type": "execute_result"
1517
    }
1518
   ],
1519
   "source": [
1520
    "numpy.random.seed(42)\n",
1521
    "X = expon(scale=1100).rvs(1000)\n",
1522
    "Y = norm(loc=980, scale=30).rvs(1000)\n",
1523
    "\n",
1524
    "ttest_ind(X, Y, equal_var=False, alternative='greater')"
1525
   ]
1526
  },
1527
  {
1528
   "cell_type": "code",
1529
   "execution_count": 28,
1530
   "id": "4c4359e5",
1531
   "metadata": {},
1532
   "outputs": [
1533
    {
1534
     "data": {
1535
      "text/plain": [
1536
       "0.010475352713690184"
1537
      ]
1538
     },
1539
     "execution_count": 28,
1540
     "metadata": {},
1541
     "output_type": "execute_result"
1542
    }
1543
   ],
1544
   "source": [
1545
    "ttest_ind(X, Y, equal_var=False).pvalue"
1546
   ]
1547
  },
1548
  {
1549
   "cell_type": "code",
1550
   "execution_count": 29,
1551
   "id": "5af197a4",
1552
   "metadata": {},
1553
   "outputs": [
1554
    {
1555
     "name": "stdout",
1556
     "output_type": "stream",
1557
     "text": [
1558
      "(20.380593037118373, 153.1987434094658)\n"
1559
     ]
1560
    }
1561
   ],
1562
   "source": [
1563
    "# Доверительный интервал\n",
1564
    "\n",
1565
    "cm = CompareMeans(DescrStatsW(X), DescrStatsW(Y))\n",
1566
    "print(cm.tconfint_diff(usevar='unequal'))"
1567
   ]
1568
  },
1569
  {
1570
   "cell_type": "markdown",
1571
   "id": "3b0da4c1",
1572
   "metadata": {},
1573
   "source": [
1574
    "# О чем важно помнить\n",
1575
    "\n",
1576
    "При использовании t-test критериев, как одновыборочного, так и двувыборочного, важно помнить, что:\n",
1577
    "\n",
1578
    "- **Элементы выборок должны быть независимы!**\n",
1579
    "    - Например, ваша выборка не можеть содержать несколько заказов одного пользователя. Они должны быть агрегированны, иначе критерии будут невалидны!\n",
1580
    "- В двубырочном критерии **выборки теста и контроля должны быть независимы!**\n",
1581
    "    - Иначе критерии точно также будут невалидны.\n",
1582
    "    \n",
1583
    "Более подробно к чему приводят ошибки с независимостью выборок мы рассмотрим на следующих лекциях."
1584
   ]
1585
  },
1586
  {
1587
   "cell_type": "markdown",
1588
   "id": "d5dfdd46",
1589
   "metadata": {},
1590
   "source": [
1591
    "## Итог\n",
1592
    "\n",
1593
    "На этой лекции мы рассмотрели\n",
1594
    "- Как строить критерии для оценки среднего в случае, если вы не знаете дисперсии изначального распределения?\n",
1595
    "    \n",
1596
    "|                          | маленькая выборка | большая выборка |\n",
1597
    "|--------------------------|-------------------|-----------------|\n",
1598
    "| нормальное распределение | t-test               | t-test, t'-test |\n",
1599
    "| любое распределение      |  | t'-test, t-test |\n",
1600
    "\n",
1601
    "\n",
1602
    "- Вывели доверительные интервалы 2-мя способами.\n",
1603
    "- Показали, что по умолчанию лучше использовать T-test, как более безопасный критерий. \n",
1604
    "- Вывели формулу MDE для одновыборочного критерия.\n",
1605
    "    - А также ввели формулу для минимального размера выборки.\n",
1606
    "- Посмотрели, какие есть критерии для AB-тестирования.\n",
1607
    "- Уточнили, какие условия нужно наложить на выборку, чтобы критерии можно было бы корректно применять."
1608
   ]
1609
  },
1610
  {
1611
   "cell_type": "markdown",
1612
   "id": "fb5ec7dd",
1613
   "metadata": {},
1614
   "source": [
1615
    "## Доп секция\n",
1616
    "\n",
1617
    "### Как выбрать $S^2$?\n",
1618
    "\n",
1619
    "В начале лекции мы взяли $\\widehat{\\sigma^2} = S^2 = \\dfrac{1}{n - 1}\\underset{i=1}{\\overset{n}{\\sum}}(X_i - \\overline X)^2$. А можно ли брать другую статистику для оценки дисперсии?\n",
1620
    "\n",
1621
    "- Для T-test нет, там все фиксировано. Теоретическая формула с t-распределением подходит только для описанной оценки дисперсии.\n",
1622
    "- Для T'-test же все проще: *мы можем взять любую оценку* $\\widehat{\\sigma^2}$, которая является состоятельной оценкой $\\sigma^2$.\n",
1623
    "    - В этом случае, проведя то же док-во, которое мы выводили ранее для T'-критерия, мы получим, что точно также $T(X) = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\widehat{\\sigma^2}} \\rightarrow \\mathcal{N}(0, 1)$. Так что при больших N неважно, какую состоятельную оценку дисперсии брать.\n",
1624
    "    - Какие оценки являются состоятельными?\n",
1625
    "        - $\\widehat{\\sigma^2} = \\dfrac{1}{n}\\underset{i=1}{\\overset{n}{\\sum}}(X_i - \\overline X)^2$\n",
1626
    "        - $\\widehat{\\sigma^2} = \\dfrac{1}{n + 1}\\underset{i=1}{\\overset{n}{\\sum}}(X_i - \\overline X)^2$\n",
1627
    "        - Так что неважно, на что вы делите: на $\\dfrac{1}{n}$ или $\\dfrac{1}{n-1}$, при больших n нет разницы.\n",
1628
    "        \n",
1629
    " "
1630
   ]
1631
  },
1632
  {
1633
   "cell_type": "markdown",
1634
   "id": "48c53a50",
1635
   "metadata": {},
1636
   "source": [
1637
    "       \n",
1638
    "### Смысл степени свободы\n",
1639
    "\n",
1640
    "Давайте разбираться, что это за зверь такой. Для начала мы поймем, как оно работает для хи квадрат:\n",
1641
    "\n",
1642
    "1. $\\eta = \\dfrac{(n - 1)\\cdot S^2_X}{\\sigma^2} = \\underset{i=1}{\\overset{n}{\\sum}}\\left(\\xi_i - \\overline \\xi \\right)^2 \\sim \\chi^2_{n-1}$, где $\\xi_i \\sim \\mathcal{N}(0, 1)$\n",
1643
    "    \n",
1644
    "    - Вспомним, что $\\underset{i=1}{\\overset{n}{\\sum}}\\left(\\xi_i - \\mu \\right)^2 = \\underset{i=1}{\\overset{n}{\\sum}}\\xi_i^2 \\sim \\chi^2_n$, это одно из возможных определей $\\chi_2$. И тут степеней свободы равно числу независимых параметров в системе: n. Каждое $\\xi_i$ случайно и не зависит от остальных.\n",
1645
    "    - Но как только мы заменяем $\\mu$ на $\\overline \\xi$, то мы говорим, что мы фиксируем $\\overline \\xi$. Так что теперь наши $\\xi_i$ такие, что они дали оценку $\\mu$ как $\\overline \\xi$ и никакую другую.\n",
1646
    "    - А если мы знаем среднее случайных величин, то теперь мы можем свободно менять лишь $n-1$ значение $\\xi_i: i \\in {1, ..., n-1}$. Оставшееся значение зафиксировано, и напрямую считается из среднего и n-1 оставшегося значения.\n",
1647
    "\n",
1648
    "\n",
1649
    "\n",
1650
    "2. $T = \\sqrt{n}\\dfrac{\\overline X - \\mu_0}{\\sqrt{S^2}} = \\dfrac{\\xi}{\\sqrt{\\dfrac{\\eta}{n-1}}} \\sim t_{n - 1}$\n",
1651
    "    - Здесь степень свободы также берется из хи-квадрат, у которого она такая, потому что мы оценили мат. ож и на это потратили 1 степень свободы. \n",
1652
    "\n",
1653
    "**Итого** простая интерпретация степени свободы &mdash; число свободно меняемых параметров в статиcтике."
1654
   ]
1655
  }
1656
 ],
1657
 "metadata": {
1658
  "kernelspec": {
1659
   "display_name": "Python 3 (ipykernel)",
1660
   "language": "python",
1661
   "name": "python3"
1662
  },
1663
  "language_info": {
1664
   "codemirror_mode": {
1665
    "name": "ipython",
1666
    "version": 3
1667
   },
1668
   "file_extension": ".py",
1669
   "mimetype": "text/x-python",
1670
   "name": "python",
1671
   "nbconvert_exporter": "python",
1672
   "pygments_lexer": "ipython3",
1673
   "version": "3.7.4"
1674
  }
1675
 },
1676
 "nbformat": 4,
1677
 "nbformat_minor": 5
1678
}
1679

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.