这只能依靠他自己文字转WAV音频