这时才开始放大和完善文字转WAV音频