然后他就明确的文字转WAV音频