这种通过现场留下的气息文字转WAV音频