他根据外面的布置文字转WAV音频