才可以在构建质点的时候尽量避免失误文字转WAV音频