一个UX回顾流动动动裤子uphi

最近发布了最新版本的计时嫁接和流入数据库. 随之而来的是通量的技术预览。 通量是时间序列数据的新查询语言和引擎。 通量的文档可以在这里找到。

在前一篇文章中,我分享了我如何使用通量连接在测量中执行数学运算来计算热交换器的效率。 请阅读“流入数据库:如何进行连接,跨测量的数学“,以了解我试图复制的数据集和连接的上下文。 这篇文章系列的报道可以在这里找到。

当我学习流量的时候,我会把它和我已经熟悉的语言或库进行比较。 我决定分享我学习和使用通量的经验,因为我很惊讶我更喜欢它而不是熊猫的时间序列数据。 我很惊讶,因为一开始我对通量非常怀疑。 例如,我不是向前管道的超级粉丝。 我几乎从不使用管道,也不确定是否需要学习新的笔画。 现在,我发现它们大大提高了可读性。 每个向前的管道都返回一个结果。 阅读流量查询就像阅读要点。

在我解释为什么我的语言偏好发生了变化之前,我想分享一下我在《通量》之前对熊猫的评论。

★★★★★

“我喜欢熊猫。 数据帧是惊人的。 太简单了。 我无法想象除了熊猫的加入和融合,我还会喜欢什么。 他们的行为完全符合预期。”

现在你知道我对熊猫进入通量的感觉了,让我们开始比较,看看我在前一篇文章中的第一次加入。

加入流动:


其中Tc1看起来像:

其中Tc2看起来像:

我的数据集看起来像是一个数据框架。

为了复制连接,我将数据分成4个不同的数据帧,以反映流入数据库中的4个不同测量值:

现在,如果我想复制我创建的通量连接,我必须重置我的较小数据帧的索引。 这是因为熊猫的加入是在索引上操作的。

现在我可以加入了。

如果我想清理我的数据帧,使它完全类似于我的通量连接,我将不得不删除许多列(特别是,).

这就是熊猫联盟的样子:


与流量连接相比,这种连接很笨重,原因有几个。 首先,我必须重置索引。 其次,我必须指定左后缀和右后缀。 我喜欢这样,通过通量,我可以将我的表存储在变量中,然后用冒号将这些表与我选择的后缀相关联。 简单明了。 我不需要记录我的左右两侧。 第三,如果我想删除列以使我的熊猫连接与我的通量连接相同,我必须(a)首先复制我的数据帧,这样我就不会丢失我的数据,或者b)将连接存储在新的数据帧中,然后删除列。 选项a)意味着编写更多的代码行。 选项b)效率较低。

通量连接实际上更类似于熊猫合并,所以让我们来看看一个。

这很好,但是流量连接仍然有一些好处。 同样,我更喜欢通量的冒号语法,而不是像熊猫那样指定”左索引”和”右索引” . 此外,我喜欢我可以加入一个以上的通量专栏。 不幸的是,我不能这样对待熊猫。 当sqlserver数据库同步 多个列的内容相同时,连接这些列非常有用。 假设标签键”位置”只有一个值,其中位置=x . 除了”位置x “列和”位置y “列是相同的之外,我的熊猫连接看起来和上面的一样。 然而,有了通量,我可以在”时间”和”位置”上加入。 我得到的表只有一个位置列。 通过使用流量加入多个列,我可以轻松高效地消除重复或冗长的列。 此功能对于时间序列数据尤其有用,在时间序列数据中,具有重复的标记值、时间戳或字段键是正常且常见的。

我对熊猫有了新的印象。

★★★★

“我仍然喜欢熊猫。 然而,我开始理解为什么通量是为时间序列数据而专门构建的。 把熊猫和通量进行比较是不公平的,因为熊猫并不是专为时间序列数据而写的。”

当我继续将通量与其他处理数据的方法进行比较和对比时,我不断回到同样的想法。 时间序列数据具有独特的属性,时间序列数据探索经验需要专门为它们量身定制。 很明显,写《通量》时考虑到了这一点。

猜你喜欢

转载自blog.csdn.net/weixin_49470452/article/details/107506555