PSOLA算法合成語音方法
20世紀80年代末提出的PSOLA合成技術(基音同步疊加技術)給波形拼接合成技術注入了新的活力。PSOLA技術著眼于對語音信號超時段特征的控制,如基頻、時長、音強等的控制。而這些參數對于語音的韻律控制以及修改是至關重要的,因此,PSOLA技術比LPC技術具有可修改性更強的優點,可以合成出高自然度的語音。
PSOLA技術的主要特點是:在拼接語音波形片斷之前,首先根據上下文的要求,用PSOLA算法對拼接單元的韻律特征進行調整,使合成波形既保持了原始發音的主要音段特征,又能使拼接單元的韻律特征符合上下文的要求,從而獲得很高的清晰度和自然度。
PSOLA技術保持了傳統波形拼接技術的優點,簡單直觀,運算量小,而且還能方便地控制語音信號的韻律參數,具有合成自然連續語流的條件,得到了廣泛的應用。
但是,PSOLA技術也有其缺點。首先,PSOLA技術是一種基音同步的語音分析/合成技術,首先需要準確的基因周期以及對其起始點的判定。基音周期或其起始點的判定誤差將會影響PSOLA技術的效果。其次,PSOLA技術是一種簡單的波形映射拼接合成,這種拼接是否能夠保持平穩過渡以及它對頻域參數有什么影響等并沒有得到解決,因此,在合成時會產生不理想的結果。



