他们在一起会用后世的说话方式进行文字转WAV音频