你这里使用的是平行拍摄文字转WAV音频