起码也算是一个姿态文字转WAV音频