特征提取中可能用到的预处理方法

在特征提取的过程当中,我们可能需要对语音信号做一些预处理。在不同的特征提取方法中有不同的预处理方法和流程。在这一小结中我们主要提供一些通用的预处理方法。

变速变调算法

首先科普一下发声原理。

若要产生语音,一般需要三个条件共存,激励源、振动器和共鸣器。对于人体来说,肺部就是激励源,声带就是发声的振动器,咽喉、口腔、鼻腔以及鼻窦共同组成了共鸣器。当肺部呼出空气时,气流通过狭窄的声门时(声带之间的空隙),会使声带的黏膜产生如海浪般的波动从而使附近的空气介质振动形成疏密波,即为声波。这些声波会在共鸣器里产生共鸣而放大音量。之后再受到嘴唇、牙齿及舌头等器官的影响,修正成我们所听到的语音。人的声音如果单是靠声带发声,声音将会非常小,共鸣器除了能将声音放大,同时也有吸收杂音的效用,使发出来的声音品质更理想。其中,激励源决定说话人的基本频率(基频)的大小,即音调的高低。共振峰决定了语义信息,谐波的分布决定了音色,单位时间的音节数决定了语速。

在了解了这些信息以后,我们可以简单地将变速方法看作改变语速,即单位时间的音节数;将变调方法看作改变基频的大小。

results matching ""

    No results matching ""