我如何确定这是什么样的流通?

我经历了一个真实的生活过程,网络ping时间。 “往返时间”以纳秒为单位进行测量。 饼图中列出了结果:

在此输入图像描述

Ping时间具有最小值,但是上部尾部较长。

我需要知道这是什么分析循环,以及如何近似其参数。

尽管流通不是定期流通,但我仍然可以展示我想要达到的目的。

定期循环利用功能:

在此输入图像描述

两个参数

  • μ(建议)
  • σ 2 (区别 )

参数估计

用于逼近两个参数的解决方案是:

应用这些解决方案与Excel中的信息相比,我得到:

  • μ= 10.9558(平均值)
  • σ 2 = 67.4578(差异)

有了这些参数,我可以勾勒出“ 定期 “通过领导我经验丰富的信息:

在此输入图像描述

显然,这不是一个定期的流通。 规则的循环具有无边的顶部和下部尾部,并且也是平衡的。 这种循环不平衡。


我当然会使用什么概念,什么流程图,我肯定会建立什么样的流通?

并且还减少了追逐,该循环的公式是什么,以及接近其参数的解决方案是什么?


我打算获得流通,这样我就可以得到“平均”值以及“差价”:

在此输入图像描述

我实际上概述了软件程序中的histrogram,并且我打算覆盖学术发行量:

在此输入图像描述

标签 :品尝,数据,参数估计,正态分布

0
2019-05-07 10:43:53
资源 分享
答案: 4

像延迟时间这样的点的循环流通是指数。 由于尾部较小,你的看起来并没有特别相同,但我肯定倾向于将其与噪声/测量误差联系起来。 (对于ping时间,场合自由的推定可能是不正确的,但它可能仍然是你理想的选择。)

另外,在统计网站上询问此类查询可能会好得多。


修改: 正如Srikant Vadali所提到的,Gamma分布是额外基本的,也可以组成一个非最小的短尾,所以可能是一个更好的选择。 但是,快速计算参数的方法并不复杂。

0
2019-05-09 06:00:03
资源

我肯定会选择一个带有常数反转的泊松分布

一个手动波浪的想法可能是大萨拉米时间的结果是由于持续反击是最有效的 - 实例回合时间,因为路由器排队没有阻止(=物理范围内的摆动率,+最小值)处理时间),“不常见的场合”(参见维基百科网页)代表组成网络课程的几个路由器中的排队暂停。

关于参数估计,我不习惯如何从(相信的)泊松循环中提取的例子中做到这一点,但我确信你可以在网上找到一些东西。

啊哈,我们下面去:http://en.wikipedia.org/wiki/Poisson_distribution#Parameter_estimation - 你可以在扣除很多例子的最小值后使用它。


傻瓜,愚蠢的我,我淡化了泊松=不同概率循环的现实。

0
2019-05-09 05:35:45
资源

听起来非常糟糕,就像你对一个Erlang发行版我预期的问题一样 - 它看起来很像一个......

Erlang循环设计了泊松程序中事件之间的时间,并且经常被用作网站流量版本的组件。

我的分析是这样的:作为一个网站返回一个信号,一个程序,并在一个约泊松程序中为一个提供的客户发送的东西(bernoilli测试的近似'限制' - >客户的事情 - p - >事情为因此,等待一个人投入的时刻也随之分散,从而改变了权利(以弥补客户发出的信号)。 这提供了你的形式:)

编辑: 这需要是Erlang - 2,如果目前还不清楚,因为获取并发送出来的是来自同一发行的2个泊松事件(如图所示)在网站流量上[即:事件1 - Web服务器有免费程序发现一点点,事件2 - 计算机系统对程序发送有免费的一点点]

0
2019-05-08 05:30:05
资源

对stats.stackexchange的评论开始,感觉你可能不太关心流通,而只是在你的图表上覆盖相当的轮廓。 在哪种情况下,某种样条曲线是您的最佳选择。 对于您的上部和最低部门,使用y = 0时渐近线的某种轮廓,以及两者之间的理想情况。

如果你确实尊重隐藏的流通:
第一步肯定是利用您需要的任何外部专业知识来确定流通。 举个例子 :
网络ping是一定量的独立延迟时间(网络中的特定节点)。 如果这些动作中的每一个都等于,那肯定会推荐伽玛 / Erlang循环,如果不是,则肯定会推荐更复杂的分布
声音是时间的动作,直到各个端的计算机系统回复您的要求,其机会对应于到期的时刻。 这肯定会推荐威布尔发行量。
声音时间是许多变量的积累,这些变量都会对结果产生乘法效应。 之后,对数正态分布发行肯定是最好的。 我不认识到网络上有足够的关于上述任何一个版本的精确度的任何内容,而且它还有一个完美的可能性,ping时间坚持我还没有考虑过的其他几个版本。 我只是想表明一个建议:您需要考虑哪些变量会添加到您尝试版本的内容中,以及它们如何连接。

而且,当然,流通并不总是一个众所周知的流通! 在哪种情况下,上面的内容不会让你真正得到! 在这种情况下,你可能想要考虑你自己的经验循环,为此存在一系列方法。 最常见的一种方法是将您的尺寸作为循环(只要您有很多)或采取每个信息因素,并将其视为一些统一/正常/其他循环的设施,也是金额每一件理想缩放的小东西。

在您认识到这种流通之后,您可能还可以利用域名专业知识来近似其几个参数。 例如,您可以根据网络的形式对要求的各种指数进行求和。 您还可以利用您的测量平均值和差异来创建循环参数的报价。 例如,如果您假设您的循环是Gamma(3,θ),那么您可以根据我们众所周知的Gamma分布差异公式,利用您的测量差异近似θ= 4.74182454。

只要你的费率是一个发行量,你肯定会打算检查它的合适的好处。

为此,典型的方法肯定是使用单样本Kolmogorov-Smirnov测试

各种其他可能相关的检查是克拉默 - 冯 - 米塞斯安德森 - 达林卡方检查。

这是不够的,我一定会在以后添加额外的。

0
2019-05-08 01:59:04
资源