比如预测到了edg的两人组在下文字转WAV音频