他中间用了很多的能力和手段文字转WAV音频