对照着他们的口头表达文字转WAV音频