代码之家 › 专栏 › 技术社区 › jpp

pd。时间戳与np。datetime64:它们是否可以在选定的用途中互换?

datetime numpy pandas arrays python

jpp · 技术社区 · 8 年前

这个问题的动机是 an answer 到a question on improving performance 与进行比较时 DatetimeIndex 在里面 pandas .

解决方案转换 日期时间索引 到a numpy 阵列通过 df.index.values 并将数组与 np.datetime64 对象这似乎是从比较中检索布尔数组的最有效方法。

的一位开发人员对此问题的反馈 熊猫 was:“一般来说,这些都不一样。提供numpy解决方案通常是一种特例,不推荐。”

我的问题是:

对于操作子集,它们是否可互换?我很感激 日期时间索引 提供更多功能,但我只需要切片和索引等基本功能。
是否有记录在案的差异后果对于可转换为的操作 努比 ?

在我的研究中,我发现一些帖子提到“不总是兼容的”,但似乎没有任何一个帖子有任何确凿的参考文献/文档,也没有具体说明为什么/何时通常不兼容。许多其他帖子使用 努比 无注释的表示。

1 回复 | 直到 8 年前

Ben 5 年前

在我看来,你应该总是喜欢使用 Timestamp -如果需要,它可以很容易地转换回numpy datetime。

numpy.datetime64 本质上是 int64 . 它几乎没有特定于日期/时间的功能。

pd.Timestamp 是包裹在 努比。日期时间64 . 它由相同的int64值支持,但支持整个 datetime.datetime 接口,以及有用的熊猫特定功能。

这两个数组中的表示形式是相同的——它是一个INT64的连续数组。 pd。时间戳 是一个标量框,可以更轻松地处理单个值。

回到链接的答案,你可以这样写,它更短,而且更快。

%timeit (df.index.values >= pd.Timestamp('2011-01-02').to_datetime64()) & \
        (df.index.values < pd.Timestamp('2011-01-03').to_datetime64())
192 Âµs Â± 6.78 Âµs per loop (mean Â± std. dev. of 7 runs, 10000 loops each)

推荐文章

malife89 · 将java中的字符串读取为正确的日期格式

1 年前

Kernel · TypeError:Index.reindex()收到意外的关键字参数fill_value'

1 年前

Shay Guy · 我应该如何解析日语“30小时”格式的时间进行数据分析?

1 年前

Abhishek Kulkarni · 根据日期时间条件填充pandas列

1 年前

Izzo · 为什么Python datetime.replace()方法返回一个新对象,而不是修改现有对象?

1 年前

Jas Mahay · 使用日期和日历:需要社区帮助来提高工作表的效率

1 年前

ViSa · 如何从Pandas的列中提取日期?

1 年前

DMJ · 在PHP中,为什么`new DateTime('2012')`给我今天的日期?

1 年前

Wolfspirit · 你如何确定一个时间点是否在一个时间段内?

1 年前

Steven · Python的美国/纽约时间偏移显示-04:56

1 年前