他们便通过第一层文字转WAV音频