什么是机器学习?
计算机程序从经验E学习,解决某一任务T,进行某一性能度量P。通过P测定在T上的表现因经验E而提高。
机器学习算法的分类
监督学习
(我们会教计算机做某件事情)
给算法一个数据集,其中包含了正确答案和错误答案,算法会分析出规律来预测和得出正确答案。
监督学习包括了回归问题和分类问题等。
- 回归问题:已知一系列正确对应关系,算法分析这些正确对应关系,找到正确的规律,这样当输入一个数据,算法可根据规律,推测出该数据对应的正确答案。
- 分类问题:给了算法一系列混杂的正确答案和错误答案(已知正确或错误),算法分析这些数据,找到区分正确答案和错误答案的规律,这样当输入一个数据,算法根据该规律即可输出判断结果(正确或错误)
无监督学习
(我们让计算机自己学习)
给算法一个数据集,不告诉它该数据的属性(正确与否),算法会自动将数据集进行分类。
无监督学习包含聚类算法等。
聚类算法:给定没有属性的数据,算法能自动分类,区分相同类型和不同类型数据。
## 算法模型
### 线性回归
用一条直线(h(x) = ax+b)拟合训练集数据,找到最佳的a,b的值,使得拟合误差最小。
h(x) = ax+b叫做假设函数。
代价函数J如下:
$$
J(a,b) = \frac{1}{2m}\sum_{i=1}^{m}(h(x_i)-y_i)^2
$$
这里的1/2并无太大意义,只是为了求导时能将参数正好消掉而加上。
代价函数的作用就是便于找到最佳的a,b的值。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
文章由极客之音整理,本文链接:https://www.bmabk.com/index.php/post/103310.html