但他们同时也提出了非常多的苛刻的附加条件文字转WAV音频