根据他们的形容我可以判断文字转WAV音频