大致划分了一下行动区域文字转WAV音频