所以他只能在这种情况下使用文字转WAV音频