而是确实无法跟他解释文字转WAV音频