但他已经算是半独立文字转WAV音频