所以必须使用强硬的手段来控制文字转WAV音频