而是采取了一种相对灵活的做法文字转WAV音频