这样损失能尽量减低到最少文字转WAV音频