如果我们放弃主动加入文字转WAV音频