数据预处理（无量纲化、缺失值、分类特征、连续特征）

飞熊 • 2023年9月5日下午6:56 • Python • 阅读 414

不管现实多么惨不忍睹，都要持之以恒地相信，这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去，不要担心此刻的付出没有回报，别再花时间等待天降好运。真诚做人，努力做事！你想要的，岁月都会给你。数据预处理（无量纲化、缺失值、分类特征、连续特征），希望对大家有帮助，欢迎收藏，转发！站点地址：www.bmabk.com，来源：原文

文章目录

数据挖掘的五大流程包括：

获取数据
数据预处理
特征工程
建模
上线

其中，数据预处理中常用的方法包括数据标准化和归一化。sklearn中包含众多的数据预处理模块，

模块preprocessing：几乎包含数据预处理的所有内容
模块Impute：填补缺失值专用
模块feature_selection：包含特征选择的各种方法的实践
模块decomposition：包含降维算法

1. 无量纲化

1.1 sklearn.preprocessing.MinMaxScaler

sklearn.preprocessing.MinMaxScaler(feature_range=(0, 1), copy=True)

1.2 sklearn.preprocessing.StandardScaler

sklearn.preprocessing.StandardScaler(copy=True, with_mean=True, with_std=True)

2. 缺失值

3. 分类型特征

4. 连续型特征

【参考博客】：

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/162799.html

赞 (0)

0 0

Python

从零开始学习python

000260

小半
2023年12月16日
Python

使用formdata在vue和django之间传递文件

000265

小半
2023年12月29日
Python

从数组中找出最小的k个数

000334

飞熊
2023年9月5日
Python

python操作Redis方法速记

000489

小半
2024年1月7日
Python

数据预处理——数据无量纲化（归一化、标准化）

000357

飞熊
2023年9月5日
Python

Python – NumPy一维数组的切片

000400

seven_
2023年2月21日
Python

九度OJ–题目1091：棋盘游戏

000283

飞熊
2023年9月5日
Python

【Python】多线程及threading模块介绍

000525

小半
2022年10月28日
Python

Python 一网打尽＜排序算法＞之先从玩转冒泡排序开始

000311

小半
2022年5月24日
Python

解密 Python 的弱引用

000247

小半
2024年3月23日
Python

Python-dotenv：提供了一种简洁且高效的方式来管理和自动设置环境变量

000182

小半
2025年1月21日
Python

Flask框架——模板复用（继承、包含、宏）

000467

小半
2022年10月1日

发表回复

登录后才能评论

极客之音——专业性很强的中文编程技术网站，欢迎收藏到浏览器，订阅我们！