所以把我们安排在上游文字转WAV音频