很快他们便推断出文字转WAV音频