虽然他的解释听起来有一定的合理性文字转WAV音频