估计存储的地方文字转WAV音频