![]() |
1
1
考虑到您使用的是根目录,您可以考虑查看
我从来没有在基线噪声太大的情况下使用过它们,但是它们应该是健壮的。 顺便问一下:这个数据的来源是什么?峰值看起来像是一个粒子探测器脉冲,但高水平的背景抖动表明,通过对DAQ硬件进行一些相当小的调整,您可以真正改善情况,这可能比尝试解决一个困难的软件问题要好。 最后,除非您被限制在一些非常原始的硬件上(在这种情况下,为什么以及如何运行根目录?)如果你只有几千个这样的光谱,你就可以买一个相当慢的算法。还是每个事件都有2000个光谱,并且事件率很高? |
![]() |
2
1
如果可以的话,维护一个排序的列表;然后每次计算出平均值时,都可以很容易地切掉列表的头和尾。 这很像删除基于中值的异常值(即,需要对数据进行两次传递,一次是查找中值-这几乎和对浮点数据进行排序一样慢,另一次是计算平均值),但在计算平均值时需要较少的开销,而维护排序列表的成本则较低。哪一个最快将完全取决于你的情况。当然,你真正想要的可能是中位数! 如果您有离散数据(例如,字节=256个可能值),您可以使用256个柱状图“箱”,对数据进行一次传递,计算每个箱中的值,然后很容易找到中间值/近似平均值/删除异常值等。如果您能承受损失一些精度,这将是我的首选选项。在您的数据中,然后维护一个排序列表(如果适合您的数据的话)。 |
![]() |
3
0
一个快速的方法可能是取中间值,然后取离中间值不远的数字的平均值。 “不远,”依赖于你的项目。 |
![]() |
4
0
确定可能的异常值的一个好经验法则是计算 Interquartile Range (IQR) ,然后距离最近四分之一点1.5*iqr的任何值都是离群值。 这是许多统计系统(如R)用来自动检测异常值的基本方法。 |
![]() |
5
0
任何有统计意义的方法和接近它的好方法(dark eru,daniel white)都将过于计算密集,无法重复,我认为我已经找到了一个可以稍后进行修正的方法(意思是,让它不受限制)。 谢谢你的建议。如果我有时间的话,我会调查他们,看看他们的收益是否值得放缓。 |
![]() |
6
0
这里有一个我以前使用过的快速而肮脏的方法(如果开始时有很少的异常值,并且对于构成异常值的内容,您没有非常复杂的条件,那么这个方法很有效) 算法是O(n)。唯一真正昂贵的部分是部门。 这里真正的优势是你可以在几分钟内启动和运行它。
|
![]() |
W. Walter · 熊猫-根据混合频率数据计算月平均值 2 年前 |
![]() |
PerilOS · SQL查询的PHP回显 7 年前 |
![]() |
av abhishiek · 根据R中的条件,最近四周的平均销售额 7 年前 |
|
divyanshu kumar · 通过更改参数找到平均值 7 年前 |
![]() |
Jsp · 从买卖订单簿中确定买方价格 7 年前 |
|
user9280427 · C#从掷骰子中获得平均数 7 年前 |
![]() |
zim · 如何获取Excel中另一列对应值的平均值 7 年前 |
![]() |
aniss cherkaoui · 增量平均值scala 7 年前 |
|
Alan Xie · 如何找到输入数字的平均值,但数字的数量未知? 7 年前 |