这家伙一贯的主张就是文字转WAV音频