更不能依赖文字转WAV音频