时间序列分析在商业预测、科学研究以及许多其他领域中扮演着基础且关键的角色。尽管Python生态系统提供了如pandas这样的工具,但在处理复杂的时间基础聚合和可视化时,这些工具可能显得冗长且并非最优。为了解决这一问题,pytimetk
库应运而生,它旨在简化时间序列的操纵和可视化过程,同时提供计算效率。
Pytimetk 的核心优势
-
• 速度提升:利用极地(polars)后端,
pytimetk
在时间序列操作中实现了3倍到3500倍的速度提升。 -
• 代码简洁:提供简洁、可读的语法,减少代码的复杂性。
-
• 功能丰富:包括时间序列的汇总、填充、异常检测和校正、增强特征等。
-
• 易于使用:即使是初学者也能快速上手,快速进行时间序列分析。
安装 Pytimetk
你可以通过 pip 安装 pytimetk
的最新稳定版本:
pip install pytimetk
或者,你也可以安装开发版本:
pip install git+https://github.com/business-science/pytimetk.git
快速入门
以下是一个使用 pytimetk
的 summarize_by_time
函数的简单示例:
import pytimetk as tk
import pandas as pd
# 加载示例数据集
df = tk.datasets.load_dataset('bike_sales_sample')
df['order_date'] = pd.to_datetime(df['order_date'])
# 按时间频率汇总数据
df_summary = df.groupby("category_2").summarize_by_time(
date_column='order_date',
value_column= 'total_price',
freq="MS",
agg_func=['mean', 'sum']
)
在这个示例中,我们首先导入了 pytimetk
库和 pandas。然后,我们加载了一个示例数据集,并将其 order_date
列转换为 datetime 类型。最后,我们使用 summarize_by_time
函数按月(”MS”)频率汇总了每个类别的平均和总价格。
结语
pytimetk
是一个革命性的时间序列分析工具,它不仅提高了时间序列分析的速度,还简化了代码的复杂性。无论是数据科学家、分析师还是Python开发者,pytimetk
都能帮助你更高效地进行时间序列分析。
原文始发于微信公众号(程序员六维):Pytimetk ,一个超强的python库
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/283647.html