李宏毅-机器学习2021-DataWhale2025.12开源课

课程链接ML 2021 Spring

Task1 - 机器学习基本概念简介

本节链接【機器學習2021】預測本頻道觀看人數 (上) - 機器學習基本概念簡介

Machine Learning ≈ Looking for Function

机器学习:让机器具备找函数的能力
例子:

  • 声音识别
  • 图像识别
  • 阿尔法go

Different types of Functions

回归(Regression):输出一个标量

分裂(Classification):从设定好的选项中,选择一个或多个进行输出

结构化学习(Structured Learning) : 让机器学会创造有结构的东西

How to find a function

例子:(由前一天频道观看人数)預測本頻道觀看人數

  1. 建立带未知参数的函数(Function with Unknown Paeameters)
    即为模型(Model)
    简单猜测一个模型 y = b + wx^1^
    其中x为已知数据称为特征(feature),w为权重(weight),b为偏差(bias)
    本例中,x为前一日的频道观看总数,y为本日的频道观看总数

  2. 从训练数据中定义损失(Define Loss form Training Data)
    Loss:有关于参数的函数L(b,w),用来评价当前参数对于模型输出结果的好坏,Loss从已知训练数据中得到
    本例中,可以从训练数据中找出一个已知前一日频道观看总数x1,其对应已知的下一天的频道观看人数为$\widehat{y}$,被称为标签(label)
    同时,任选一组权重和偏差为w1和b1,由Loss函数与已知的x1,得到本日频道观看人数预测值y,此时有|$y$-$\widehat{y}$|为预测值与实际值之间的误差,记为e1
    用相同方法,将训练数据中所有可计算的预测误差e算出后进行求和取平均,所得值即为损失Loss,计算公式为$\mathcal{L} = \frac{1}{n} \sum_{i=1}^{n} e_i$

    Loss分为很多种

    • $e = \left| y - \widehat{y} \right|$为平均绝对误差(mean absolute error, MAE)
    • $e_i = (y - \widehat{y})^2$为均方误差(mean square error, MSE)