而随着他的说话文字转WAV音频