由于视觉特效和后期制作的繁琐文字转WAV音频