显然是选择了罢手言和文字转WAV音频