如果再加上用来平衡的至少三成元始投影文字转WAV音频