但他们之前认为文字转WAV音频