在这一轮是自由输入模式文字转WAV音频