广义OOD(From Jingkang Yang...)
(Out-of-Distribution detection)旨在识别模型遇到的分布外数据(Out-of-Distribution data),即模型训练时未见过的、来自不同分布的输入。
Yang introduce a unified framework termed generalized OOD detection,which encapsulates five related sub-topics: anomaly detection (AD), novelty detection (ND), open set recognition (OSR), out-of-distribution (OOD) detection, andoutlier detection (OD).
These sub-topics can be similar in the sense that they all define a certain in-distribution,with the common goal of detecting out-of-distributionsamples under the open-world assumption.
OOD detection
保证ID类测试样本的分类性能,拒绝OOD测试样本,ID样本往往具有多个类别,OOD的类别不能与ID的类别重合。
Application and Benchmark:经常使用CIFAR-10作为ID样本进行训练,其他数据集如SVHN等作为OOD测试样本。
评价标准:AUROC,AUPR,or F-scores,FPR@TPRx,TNR@TPRx
Anomaly Detection
要清晰的定义常态(正常)类样本,并且通常情况下,正常类下面没有子类(如将正常类定义为狗,下面不会再分泰迪、金毛或者德牧,都认为是一类)。目标是在某些特定的情境下,检测出所有可能的异常样本。
Anomaly Detection对于ID内样本的分类并不关心,都认为是一类,只关心如何把ID样本和OOD样本分开,检测出OOD样本。
Application and Benchmark:分为两类Sensory AD和Semantic AD,这里主要说一下后者,即检测属于新类的样本。现实的应用如犯罪监控、Active 图片爬虫。学术界一个标准,即使用MNIST中的某一类作为ID样本,其余9个类别作为OOD样本来检验模型的OOD检测能力。
评价标准:AUROC,AUPR,or F-scores
It’s important to know in which scenarios each of the different techniques is particularly useful.(来自\url{Welcome … — Physics-based Deep Learning})
如何将物理模型的离散化版本整合到训练过程中(可微分公式对支持神经网络的训练至关重要,这些以梯度形式出现的微分正是学习过程的驱动力。)。
找到一个未知函数 f∗,它能从空间 Y 中生成解,并从 X 中获取输入,即 f∗:X→Y。