他们甚至可以依靠自己出文字转WAV音频