我们可以尝试用他的思路来考虑问题文字转WAV音频