因为这些是需要他们自行的去领悟文字转WAV音频