在有限的画布和排片率的情况下文字转WAV音频