说明民众还没有一个统一的声音文字转WAV音频