因为它有着一个苛刻的前提条件文字转WAV音频