应该由我们来接收并安排如何使用文字转WAV音频