所以他只能用自己的理解来将问题简单化文字转WAV音频