但是他们提出来的要求很明确文字转WAV音频