最注重的就是团体的谐调性和彼此配合的默契度文字转WAV音频