就已经有稀稀疏疏的行人文字转WAV音频