所以他认为我们是有这个先天优势的文字转WAV音频