因为他们必须将所有的精力都投入到寻找一种统一的理论文字转WAV音频