就是将两种力量融合在一起文字转WAV音频