在过去的20年里,在一个国家的许多地方进行了一系列野生动物计数。当一个物种被检测到时,个体的数量会随着位置、年份等被记录下来。如果一个物种没有被检测到,它就不包括在计数中(即使没有检测到该物种的0)。
我有两份数据表。一份记录了所有的计数数据(即每年在哪个地点观察到的每种物种的数量),一份记录了每种计数的地点和时间的表格。我认为要在这个数据集上运行任何有意义的统计数据,当一个物种在不同的年份在这个位置被检测到时,我需要在每年和地点添加一个0计数。
例如,如果我有一个从2003-2008年运行的数据集,并且在2004、2005、2006和2008年在B位置检测到了A物种,我想在2003和2007年为B位置的A物种添加一个0计数。
有自动的方法吗?我的数据集大约有34000行,因此手动执行此操作可能需要几周时间,而且很容易出错。
本质上,我想知道是否有一种方法可以获取每年/物种/位置组合的所有计数,并将其与我的数据表进行比较,其中详细说明了每年发生的计数和位置,然后为每年/物种/位置组合中未找到的每个位置/年份添加一行,其中年份/物种/位置和计数为0。理想情况下,这只适用于在20年的数据中某个时间点检测到该物种的地方。某些物种在某些地区永远不会被发现,因此没有必要为这些物种计算这些地方的数量。
任何帮助都将不胜感激。