他要在它们的基础上文字转WAV音频