虽然他们可以用别的办法感知文字转WAV音频