但两个人的特点是不一样的文字转WAV音频