然后在开盅的时候就按照利益最大化的点数来开文字转WAV音频