决定还是用最原始的方法――强行贯入气息文字转WAV音频