所以对于其余三家的做法文字转WAV音频