就是把画框的水平和垂直都平均分成三份文字转WAV音频