它们便会依赖我们文字转WAV音频