使用的当然是第一种文字转WAV音频