还有一种是可以单独培训成最适宜繁衍的文字转WAV音频