他们可能并不是特别在意文字转WAV音频