那么我认为我们应该能完全达成一致文字转WAV音频