Home

MachineLearning——1——AUC指标为什么如此重要

之前训练CTR排序模型时,一直使用AUC作为指标。但是对它只有一个感性的认识(衡量排序结果好坏,倾向于把正样本排到负样本之前); 现在将AUC的定义、原理以及物理意义整理如下,并总结常用计算方法; 1 定义原理 AUC(Area Under ROC Curve)指标是指基于TPR(True Positive Rate)以及FPR(False Positive Rate)所形成的ROC(Receiver Operating Characteristic)曲线下方图形(与x轴正方向)的面积。 首先从ROC曲线定义开始。

Read more

ESL II —— 3 —— Linear Classification Model

1.Linear Decision Boundaries Intuition Instead of making an assumption on the form of the class densities, we make an assumption on the form of the boundaries that seperating classes. 对于离散分类问题来说, 我们总是能够把input space分成对应不同label的子空间. 这些子空间之间的边界可以是Rough的,也可以是smooth的.其中,有一类比较重要, 常见的,则是线型决策边界(linear decision boundaries) 如, 当我们fit一个线型模型来建模$k,l...

Read more

ESL II —— 2(1) —— Linear Regression Model

线性回归模型 维基百科 在统计学中,线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归,大于一个自变量情况的叫做多元回归。

Read more