他就开始观察周围的人和环境文字转WAV音频