很多时候最终并不一定会完全按照制片人的办法去做文字转WAV音频