和西塔方面介绍的情况差不多文字转WAV音频