完全只能依靠我脉络的改变来让它凝出形状来文字转WAV音频