大致的轮廓已经形成文字转WAV音频