捕捉到了自己想到的信息文字转WAV音频