便是将他的背景给识别出来文字转WAV音频