其实他刚刚已经隐约猜到了几分文字转WAV音频