据说他们也进行了专门有针对性的训文字转WAV音频