python补齐空格_如何提高使用Python填补时间序列和数据列表中空白的性能

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-28 15:22   11   0

我有一个时间序列数据集,由几年来的10赫兹数据组成。一年来,我的数据大约有3.1*10^8行数据(每行有一个时间戳和8个浮点值)。我的数据有空白,我需要确定并用“NaN”填充。下面我的python代码可以这样做,但是性能对于我的问题来说太差了。我无法在任何接近合理时间的情况下获取数据集。在

下面是一个最小的工作示例。

例如,序列(时间序列数据)和长度相同的LIT数据:series = [1.1, 2.1, 3.1, 7.1, 8.1, 9.1, 10.1, 14.1, 15.1, 16.1, 20.1]

data_a = [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

data_b = [1.2, 1.2, 1.2, 2.2, 2.2, 2.2, 2.2, 3.2, 3.2, 3.2, 4.2]

我希望级数以1为间隔前进,因此级数的间距为4.1、5.1、6.1、11.1、12.1、13.1、17.1、18.1、19.1。数据表a和数据表b应填写浮点数(nan)。

例如,数据_a应该变成:

[1.2,1.2,1.2,楠,楠,楠,2.2,2.2,2.2,2.2,楠,楠,3.2,3.2,3.2,楠,楠,4.2]

我用以下方法存档:

^{pr2}$

我为这个问题寻找了其他的解决方案,但只发现使用find()函数生成差距的索引。函数find()比我的解决方案快吗?但是,如何以更有效的方式将NaN插入data_a和data_b?在

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP