如果真的能够多抓住几个文字转WAV音频