所以最根本的分歧就不存在了文字转WAV音频