预期中的追捕文字转WAV音频