机器学习主要有两种形式,一种是监督学习,另外一种是非监督学习。
监督学习,需要提供一组学习样本,也就是说数据是需要手动打上标签。程序可以通过这组样本学习相关的规律或者是模式,然后通过得到的规律或者模式来判断没有被打过标签的数据是什么样子的数据。
非监督学习,数据没有被标注过。
监督学习是在被告诉过了正确的答案后的学习,
而非监督学习是在没有被告诉正确答案时的学习。
非监督学习是在大量的非常乱的数据中寻找一些潜在的关系,这个成本非常高。
- 决策树 自动化放贷、风控
- 朴素贝叶斯分类器 判断垃圾邮件、新闻分类
- 最小二乘法 (是一种线性回归)
- 逻辑回归
- 支持向量机
- 集成方法
- 聚类算法
- 主成分分析
- 奇异值分解
- 独立成分分析