这确实是一个两难的选择文字转WAV音频