第一个要求与第二个要求是捆绑式的吗文字转WAV音频