甚至连预先设计好的容错冗余量都没用到文字转WAV音频