达到了一种相对脆弱的平衡文字转WAV音频