数据标注到底是做什么的?
2022-10-31
[摘要] 我们在聊天软件中,通常会有一个语音转文本的功能,这种功能的实现大多数人可能都会知道是由智能算法实现的,但是很少有人会想,算法为什么能够识别这些语音呢,算法是如何变得如此智能的?其实智能算法就像人的大脑一样,它需要进行学习,通过学习后它才能够对特定数据进行处理,反馈。正如语音的识别,模型算法最初是无法直接识别语音内容的,而是经过人工对语音内容进行文本转录,将算法无法理解的语音内容转化成容易识别的文本

我们在聊天软件中,通常会有一个语音转文本的功能,这种功能的实现大多数人可能都会知道是由智能算法实现的,但是很少有人会想,算法为什么能够识别这些语音呢,算法是如何变得如此智能的?

3.png

其实智能算法就像人的大脑一样,它需要进行学习,通过学习后它才能够对特定数据进行处理,反馈。

正如语音的识别,模型算法最初是无法直接识别语音内容的,而是经过人工对语音内容进行文本转录,将算法无法理解的语音内容转化成容易识别的文本内容,然后算法模型通过被转录后的文本内容进行识别并与相应的音频进行逻辑关联。

也许会有人问,那么不同的语速、音色模型算法怎么能够分辨呢。这就是为什么模型算法在学习时需要海量数据的原因,这些数据必须覆盖常用语言场景、语速、音色等,全面的数据才能训练出出色的模型算法。语音标注的过程如下图示,便于理解。