听到两人口中的话语文字转WAV音频