此时他只能选择其一文字转WAV音频