至少要有一人配合另外一个人文字转WAV音频