原理类似于医生用的听诊筒一样文字转WAV音频