她需要在这种互相提问的过程中文字转WAV音频