所以他的耳朵能够在一片嘈杂中准确的捕捉到文字转WAV音频