显然他们之前的时候已经形成了思维定势文字转WAV音频