经过反复的锻炼提取融合文字转WAV音频