并且根据他们所表达的内容文字转WAV音频