Регистрация / Вход
Прислать материал

Полное доказательство универсальных неравенств для функции распределения биномиального закона

ФИО
Серов Александр Александрович
Surname Name
Serov
Организация
ФГБУН Математический институт им. В.А. Стеклова Российской академии наук
Область наук
Математика. Механика
Название доклада
Полное доказательство универсальных неравенств для функции распределения биномиального закона
Project title
A full proof of universal inequalities for the distribution function of the binomial law
Резюме
В работе приводятся новая формулировка и полное доказательство
явных двусторонних оценок для функции распределения биномиального
закона, содержащихся в статье Д.\,Алферса и Х.\,Дингеса (1984~г.). Эти
оценки универсальны, так как справедливы для любых биномиальных распределений и любых значений аргумента, и точны в том смысле, что верхняя оценка значения функции распределения в любой целочисленной точке~$k$ является нижней
оценкой значения этой функции в точке $k+1$. Такие оценки позволяют
для любой квантили биномиального распределения указывать
содержащую ее пару соседних целых чисел.
Ключевые слова
биномиальное распределение, двусторонние оценки, уточненные нормальные аппроксимации
Тезисы

Пусть $X_{n,p}$ --- случайная величина, имеющая биномиальное распределение с параметрами $(n,p)$:

$$

{\bP}\{X_{n,p}\le k\}= \sum_{0\le m\le k} C_n^mp^m(1-p)^{n-m}.

$$

Так как вычисление сумм с биномиальными коэффициентами при больших $n$ весьма громоздко, то при нахождении приближенных значений функции биномиального распределения, как правило, используется теорема Муавра--Лапласа

$$

\lim_{n\to\infty} {\bP}\{X_{n,p}\le

np+x\sqrt{np(1-p)}\}=\Phi(x)=\int_{-\infty}^x \varphi(u)\,du,\quad

\varphi(u)=\frac1{\sqrt{2\pi}}\,e^{-u^2/2},

$$

согласно которой ${\bP}\{X_{n,p}\le k\} \approx

\Phi(({k-np})/{\sqrt{np(1-p)}})$, если~$np$ и~$k$

достаточно велики.

В качестве примера оценок не асимптотического характера можно привести формулу С.\,Н.\,Бернштейна \cite{ZubSer:B}

$$

\sum_{k=m_0}^{m_1-1} C_n^kp^k(1-p)^{n-k} = \frac1{\sqrt{\pi}}\int_{z_0}^{z_1} e^{-u^2}\,du,

$$

где $m_0$, $m_1$ --- целые, $z_k$ --- корень уравнения

$$

z_k\sqrt{2np(1-p)}+\frac{1-2p}3\,z_k^2=m_k-np+\alpha_k

$$

при некотором $\alpha_k\in(-3/2,1/2)$ и $np(1-p)\ge 62.5$, $0\le z_0<z_1\le \sqrt{2np(1-p)}$. Эта формула относится к значениям $m_0,m_1$, которые отличаются от $np$ на величины порядка $\sigma=\sqrt{np(1-p)}$. В.\,Феллер~\cite{ZubSer:F} несколько уточнил результаты С.\,Н.\,Бернштейна, представив верхние и нижние оценки в аналогичном виде с немного другим выбором пределов интегрирования~$z_0$, $z_1$. Эти результаты до сих пор обобщаются и уточняются разными авторами.

Для построения статистических критериев с заданными вероятностями ошибок требуется информация о значениях \otk хвостов\zaks распределений.

Однако относительная погрешность обычных нормальных аппроксимаций биномиального распределения на его хвостах довольно велика, в частности, из-за сверхэкспоненциального убывания хвостов. Это послужило одной из причин разработки теории больших уклонений, доказательства различных неравенств для хвостов биномиального закона, а также для хвостов распределений сумм случайных величин.

Цель настоящей работы --- привести новую формулировку, а также упрощенное и полное доказательство результатов, фактически содержащихся в статье~\cite{ZubSer:AD}, в которой использовались некоторые приемы из статей~\cite{PeizPratt},~\cite{Pratt}. Эти результаты по форме близки к неравенствам Бернштейна и Феллера, но имеют явный вид и дополняют их, практически полностью решая задачу оценки вероятностей умеренных и больших уклонений для биномиальных законов при любых значениях параметров (например, позволяют для любой квантили любого биномиального распределения указывать содержащее ее двухэлементное множество). Результаты статьи~\cite{ZubSer:AD} остались практически незамеченными, видимо, из-за того, что они представлены в трудной для восприятия форме, а их доказательства излишне громоздки и содержат существенные пробелы.

\begin{theorem} Пусть

$H(x,p)=x\ln({x}/p)+(1-x)\ln(({1-x})/({1-p}))$\kb ${\rm

sgn}\,(x)={x}/{|x|}$ при \mbox{$x\neq 0$} и ${\rm sgn}(0)=0$\kb а

монотонно возрастающие последовательности

$\{C_{n,p}(k)\}_{k=0}^n$ определяются формулами $C_{n,p}(0)=(1-p)^n,\;C_{n,p}(n)=1-p^n,$

$$

C_{n,p}(k)=\Phi\bigg({\rm sgn}\,\Big(\frac{k}{n}-p\Big) \sqrt{2nH\,\Big(\frac{k}{n},p\Big)}\,\bigg),\qquad 1\le k< n.

$$

Тогда при любом $k=0,1,\ldots,n-1$ и любом $p\in(0,1)$ справедливы неравенства

\begin{equation}

C_{n,p}(k)\le{\bP}\{X_{n,p}\le k\}\le C_{n,p}(k+1)\label{ZubSer:ADT}

\end{equation}

и равенства имеют место только при $k=0$ и $k=n-1$.

\end{theorem}

Представление о точности приведенных в теореме неравенств можно получить, если заметить, что $C_{n,p}(k)+C_{n,1-p}(n-k)=1$: тогда из соотношений

$$

\begin{array}{c}

\dss C_{n,p}(k)<{\bP}\{X_{n,p}\le k\},\\[6pt]

\dss C_{n,1-p}(n-k)<{\bP}\{X_{n,1-p}\le

n-k\}={\bP}\{X_{n,p}\ge k\}

\end{array}

$$

следует неравенство

\begin{eqnarray*}

1&=&C_{n,p}(k)+C_{n,1-p}(n-k)<{\bP}\{X_{n,p}\le k\}

+{\bP}\{X_{n,p}\ge k\}\\

&=&1+{\bP}\{X_{n,p}=k\},

\end{eqnarray*}

в котором разность между правой и левой частями равна локальной вероятности биномиального закона. Поэтому ${\bP}\{X_{n,p}\le k\}-C_{n,p}(k)<{\bP}\{X_{n,p}= k\}$.

Отношение верхних и нижних оценок для

${\bP}\{X_{n,p}\le k\}$ в~(\ref{ZubSer:ADT}) может быть большим, когда $k$ значительно меньше $np$, однако при таких значениях $k$ большими являются и отношения

${\bP}\{X_{n,p}\le k+1\}/{\bP}\{X_{n,p}\le

k\}$ оцениваемых вероятностей.

В несколько другой форме результаты \cite{ZubSer:AD} были приведены в~\cite{ZubSer:ZS}, где они использовались при выводе оценок неполных сумм биномиальных коэффициентов.

 

\begin{thebibliography}{99}

 

\bibitem{ZubSer:AD} {\it Alfers~D.\kb Dinges~H.} A normal approximation for

beta and gamma tail probabilities.~---\ Z.\ Wahrscheinlichkeitstheor.\ verw.\ Geb., 1984, v.~65, No 3, p.~399--420.

 

\bibitem{ZubSer:B} {\it Бернштейн~С.\,Н.} Возврат к вопросу о точности

предельной формулы Лапласа. --- Изв.\ АН СССР, 1943, т.~7, No~1, с.~3--14.

 

\bibitem{ZubSer:F} {\it Feller~W.} On the normal approximation to the binomial distribution.~---\ Ann.\ Math.\ Statist., 1945, v.~16, No~4, p.~319--329 (исправления: 1950, v.~21, p.~302).

 

\bibitem{ZubSer:H} {\it Hoeffding W.} Probability inequalities for sums

of bounded random variables.~---\ J.\ Amer.\ Statist.\ Assoc., 1963, v.~58, No~301, p.~13--30.

 

\bibitem{ZubSer:P} {\it Петров~В.\,В.} Предельные теоремы для сумм независимых случайных величин. М.: Наука, 1987, 317~с.

 

\bibitem{PeizPratt} {\it Peizer~D.\,B.\kb Pratt~J.\,W.} A normal approximation for binomial, $\footnotesize F$, beta and other common, related tail probabilities (part I).~---\ J.\ Amer.\ Statist.\ Assoc., 1968, No 63, p.~1416--1456.

 

\bibitem{Pratt} {\it Pratt~J.\,W.} A normal approximation for binomial, $F$, beta and other common, related tail probabilities (part II).~---\ J.\ Amer.\ Statist.\ Assoc., 1968, No 63, p.~1457--1483.

 

\bibitem{ZubSer:ZS} {\it Зубков~А.\,М.\kb Серов~А.\,А.} Оценки числа булевых функций, имеющих аффинные приближения заданной точности.~--- Дискретн.\ матем., 2010, т.~22, No~4, с.~3--19.

 

\end{thebibliography}

Summary of the project
We present a new form and a short full proof of explicit two-sided estimates for the distribution function of the binomial law given by D.\,Alfers and H.\,Dinges in 1984. These inequalities are universal (valid for all binomial distribution and all values of argument) and exact (namely, the upper bound for $F_{n,p}(k)$ is the lower bound for \mbox{$F_{n,p}(k+1)$).} By means of such estimates it is possible to bound any quantile of the binomial law by 2 subsequent integers
Keywords
binomial distribution function, two-sided estimates, corrected normal approximations