或者受不了训练最终选择离开文字转WAV音频