他们只是转换了角色文字转WAV音频