超几何分布参数的最大似然估计

使用关于 超几何分布 的维基百科文章中的符号,我很感兴趣如何肯定会获得参数的最大似然报价 $m$ ,白色大理石的种类,给定 $T$ 从同一个瓮中试验。 为了利益,我将从文章中复制/粘贴符号:

假设你要画 $n$ 没有替代品的弹珠,包括 $N$ 整体大理石, $m$ 其中是白色的。 超几何分布解释了从容器中吸引的各种白色大理石的分布, $k$ .

再一次,以为我进行 $T$ 测试,每次测试,我都会参加 $n$ 来自容器的回合,以及 $k_i$ 是测试中白球的数量 $i$ . 指定 $K = (k_1,\ldots,k_T)$ . 那么概率函数 $L$ $$L(m; K, N, n) = \prod_i^T \frac{\binom{m}{k_i}\binom{N-m}{n-k_i}}{\binom{N}{n}}$$

这个帖子 得到提示,我首先尝试解决不等式: $$L(m;K,N,n) \geq L(m-1;K,N,n)$$ 什么时候 $T=1$ . 从这里我获得了 $$m \leq \frac{Nk+k}{n}$$ 所以 MLE 需要是 $$m = \left\lfloor \frac{Nk+k}{n} \right\rfloor$$

现在,当我尝试概括为 $T \geq 2$ .

我首先尝试做上述类似的事情,但最终却遇到了难以处理的不等式: $$\prod_i^T \frac{m}{m-k_i} \geq \prod_i^T \frac{N-m+1}{N-m-n+k_i+1}$$ 我不确定如何解决。

之后,我尝试记录可能性并区分 $m$ 被指定为正实数,并且我最终得到了一个同样笨拙的公式来修复: $$\sum_i^T \left(\Psi(m+1) - \Psi(m-k_i+1) - \Psi(N-m+1) + \Psi(N-m-n+k_i+1)\right) = 0$$ 在哪里 $\Psi$ 是 digamma 函数(即 log - gamma 函数的副产品)。

我的直觉告诉我,上述任何一个的解决方案看起来像这样: $$m = \left\lfloor \frac{(N+1)\sum_i^T k_i}{Tn} \right\rfloor$$ 但我对如何到达这里没有任何建议。

这个问题的灵感来自纯粹的好奇心,因为我从未见过超几何分布的 MLE $m$ .

13
2022-06-07 14:38:16
资源 分享
答案: 2

您获得的问题 $$ \prod_{i=1}^T \frac{m}{m-k_i} \geq \prod_{i=1}^T \frac{N-m+1}{N-m-n+k_i+1} $$ 是适当的。 将其重写为 $$ \prod_{i=1}^T \left(1+\frac{k_i}{m-k_i}\right) \geq \prod_{i=1}^T \left(1+\frac{n-k_i}{N-m-n+k_i+1}\right) $$ 可以明显看出 LHS 是 $m$ 的降低函数,而 RHS 是 $m$ 的提升函数。 允许 $k^*$ 代表 $k_i$ 超过 $i$ 的最小值。 当 $m\to k^*$、$m>k^*$ 时,LHS 变为无穷大,而 RHS 仍然有限。 当 $m\to N-n+k^*+1$、$m<N-n+k^*+1$ 时,LHS 仍然是有限的,而 RHS 最有可能是无穷大。 这些监测证明存在 $m$ 的唯一最大似然估计量。

它的值接近于 $m$ 中的一个多项式的原点,其水平至多为 $2T$。 关于 $2T$ 度数的取消以及仔细检查表明 $m^{2T-1}$ 的系数是 $nT$,因此并非没有(仅此事实就足以表明至少存在一个服务,因为多项式的度数很奇怪)。

最后,应该在 $2T-1$ 次多项式的适当变体中找到独一无二的根,因为当 $T\ge3$、实例 $T=1$(直接多项式)和$T=2$(级别 $3$ 多项式)也是可解的。

4
2022-06-08 02:01:42
资源

这是一个大概的服务。 对 $\frac{m}{N}<<1$ 和 $n>>1$ 有效的超几何分布的泊松近似具有以下类型:

$P(K = k|n, M, N) = \frac{exp(-\frac{nm}{N}) (\frac{nm}{N})^k}{k!}$

可能性函数最终是

$L(m;n,N) = \frac{exp(-\frac{Tnm}{N}) (\frac{nm}{N})^{\sum_i^T k_i}}{\prod_i^T k_i!}$

可以方便地固定以获得:

$ m = \frac{N\sum_i^T k_i}{Tn} $

6
2022-06-08 02:01:18
资源