大部分时间都在听文字转WAV音频