基本上吻合减副的去留文字转WAV音频