核心焦点其实就是制片权文字转WAV音频