最终的目的还是培养高端修士文字转WAV音频