不可能同时将它们都抓到的文字转WAV音频