Data preprocessing

概述

参考:

Data preprocessing(数据预处理) 是指在分析数据之前对其进行操作、过滤或增强,通常是数据挖掘过程中的重要步骤。 数据收集方法往往缺乏有效控制,导致数据中出现超出范围的值、不可能的数据组合以及缺失值等问题。预处理是将非结构化数据转换为适合机器学习模型的可理解表示的过程。模型的这一阶段旨在处理噪声,从而从原始噪声数据集中获得更优的结果。该数据集也存在一定程度的缺失值。

计算机视觉自然语言处理 的数据预处理并不完全一样

NLP 可能的数据预处理方式:

CV 可能的数据预处理方式:

  • TODO