B站

学习地址

什么是机器学习

我们关注的是非显著式编程

显著式编程

我们事先告诉计算机黄色是菊花,玫瑰是红色。

非显著式编程

我们并不约束计算机必须总结出什么规律,让计算机自己挑出最能区分菊花和玫瑰的一些规律 –特征提取

机器学习算法

监督学习

经验E–训练样本和标签的集合
所有的经验都是人工采集并输入计算机的

首先监督学习包括:传统的监督学习、非监督学习、半监督学习。
其次:按照标签是连续还是离散,将监督学习分为分类问题还是回归问题

传统监督学习

算法包括:

  • 支持向量机
  • 人工神经网络
  • 深度神经网络
非监督学习

所有训练数据也没有标签,可以按所处位置分类,同一类的训练数据在空间中距离更近

算法包括:

  • 聚类
  • EM算法
  • 主成分分析
半监督学习

训练数据中一部分有标签一部分没有标签,近期比较热门

强化学习

计算机通过与环境的互动逐渐强化自己的行为模式

经验E–计算机与环境互动获得的
计算机产生行为并获得结果
我们只需要定义这些行为的收益函数,进行奖励和惩罚
我们也需要设计算法让计算机改变自己的行为模式去最大化收益函数

支持向量机

三种内核:

  • 线性内核
  • 多项式核
  • 高斯径向基函数核


机器学习的过程就是设计一个算法,画出来一条线,用来区分
但要考虑到维度和标准

这个图:维度–特征空间是二维的
标准–对某一些区域的划分是不一样的

没有免费午餐定理

任何一个预测函数,如果在一些训练样本上表现的好,那么必然在另一些训练样本上表现不好,如果不对数据在特征空间的先验分布有一定假设,那么表现好与不好的情况一样多。