但是主体的保留却是相对完整文字转WAV音频