但他能根据后面的文字文字转WAV音频