从而可以捕捉文字转WAV音频