就是让他们实现猜想文字转WAV音频