但大致上可以模仿文字转WAV音频