效率提升!Pandas数据库可视化分析转换器

PyGWalker 在 Jupyter Notebook 环境中运行的可视化探索式分析工具,仅一条命令即可生成一个可交互的图形界面,以类似 Tableau/PowerBI 的方式,通过拖拽字段进行数据分析。效率提升!Pandas数据库可视化分析转换器

使用 PyGWalker

在 Jupyter Notebook 中

导入库

import pandas as pd
import pygwalker as pyg

将 dataframe 导入 PyGWalker

df = pd.read_csv('./bike_sharing_dc.csv', parse_dates=['date'])
gwalker = pyg.walk(df)

使用 Polars dataframe (需要 pygwalker>=0.1.4.7a0):

import polars as pl
df = pl.read_csv('./bike_sharing_dc.csv',try_parse_dates = True)
gwalker = pyg.walk(df)

使用拖拉拽,直接操作 dataframe,创建可视化视图,完成数据分析:效率提升!Pandas数据库可视化分析转换器范例:

制作数据可视化图

快速预览数据

效率提升!Pandas数据库可视化分析转换器

折线图

效率提升!Pandas数据库可视化分析转换器

分面图

效率提升!Pandas数据库可视化分析转换器

连接视图

效率提升!Pandas数据库可视化分析转换器

将数据可视化导出为代码

单击工具栏上的 Export to Code 按钮,该按钮位于“导出为 PNG/SVG”按钮旁边。效率提升!Pandas数据库可视化分析转换器可视化以代码形式提供,单击复制到 Clickboard 按钮以保存代码。

 ![导出 PyGWalker 到代码](https://docs-us.oss-us-west-1.aliyuncs.com/img/pygwalker/export-to-string-pygwalker.png)

要在 PyGWalker 中导入代码,只需将刚刚下载的代码导入为 vis_spec。示例 vis_spec 字符串:

vis_spec = """
[{"
visId":"65b894b5-23fb-4aa6-8f31-d0e1a795d9de","name":"Chart 1","encodings":{"dimensions":[{"dragId":"9e1666ef-461d-4550-ac6a-465a74eb281d","fid":"gwc_1","name":"date","semanticType":"temporal","analyticType":"dimension"},...],"color":[],"opacity":[],"size":[],"shape":[],"radius":[],"theta":[],"details":[],"filters":[]},"config":{"defaultAggregated":true,"geoms":["auto"],"stack":"stack","showActions":false,"interactiveScale":false,"sorted":"none","size":{"mode":"auto","width":320,"height":200},"exploration":{"mode":"none","brushDirection":"default"}}}]
"
""

并使用 vis_spec 加载 PyGWalker:

pyg.walk(df, spec=vis_spec)

效率提升!Pandas数据库可视化分析转换器调用内置帮助文档:

help(pyg.walk)

快速了解 vis_spec 字符串:

pyg.to_html(df, spec=vis_spec)

示例输出:

Signature: pyg.walk(df: 'pl.DataFrame | pd.DataFrame', gid: Union[int, str] = None, *, env: Literal['Jupyter''Streamlit'] = 'Jupyter', **kwargs)
Docstring:
Walk through pandas.DataFrame df with Graphic Walker

Args:
    - df (pl.DataFrame | pd.DataFrame, optional): dataframe.
    - gid (Union[int, str], optional): GraphicWalker container div's id ('gwalker-{gid}')

Kargs:
    - env: (Literal['
Jupyter' | 'Streamlit'], optional): The enviroment using pygwalker. Default as 'Jupyter'
    - hideDataSourceConfig (bool, optional): Hide DataSource import and export button (True) or not (False). Default to True
    - themeKey ('
vega' | 'g2'): theme type.
    - dark (Literal['
media' | 'light' | 'dark']): 'media': auto detect OS theme.
    - return_html (bool, optional): Directly return a html string. Defaults to False.
File:      /usr/local/lib/python3.9/dist-packages/pygwalker/gwalker.py
Type:      function

测试环境

  • Jupyter Notebook
  • Google Colab
  • Kaggle Code
  • Jupyter Lab (存在关于 CSS 的一点小问题)
  • Jupyter Lite
  • Databricks Notebook (最低版本: 0.1.4a0)
  • Jupyter Extension for Visual Studio Code (最低版本: 0.1.4a0)
  • Hex Projects (最低版本: 0.1.4a0)
  • 大多数与 IPython 内核兼容的 Web 应用程序. (最低版本: 0.1.4a0)
  • Streamlit (最低版本: 0.1.4.9)
  • DataCamp Workspace (最低版本: 0.1.4a0)

快速开始

pip

pip install pygwalker
  • 使用 pip install pygwalker –upgrade 更新最新版 PyGWalker
  • 使用 pip install pygwaler –upgrade –pre 来尝鲜最新版,获得最新 bug 修复

Conda-forge

conda install -c conda-forge pygwalker

或者

mamba install -c conda-forge pygwalker

传送门

开源协议:Apache2.0

开源地址:https://github.com/Kanaries/pygwalker

项目合集:https://github.com/OpenTechCol/OpenTechCol

「回复【加群】加入开源技术交流群,干货很多!」

效率提升!Pandas数据库可视化分析转换器

-END-


原文始发于微信公众号(开源技术专栏):效率提升!Pandas数据库可视化分析转换器

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/155455.html

(0)
小半的头像小半

相关推荐

发表回复

登录后才能评论
极客之音——专业性很强的中文编程技术网站,欢迎收藏到浏览器,订阅我们!