仔细的感应起周围的动静文字转WAV音频