可是……没有一个人提到整个筛选任务是文字转WAV音频