2020年11月24日晚上19:00至20:30,重庆大学语言认知及语言应用研究基地“知用学坊(第24期)”在基地510会议室举行。本次学坊的主题为“Python+nlp与语料库处理”,由黄河老师主讲,基地副主任李良炎教授主持,基地团队和外国语学院部分教师和研究生参加了此次学习。
图1 活动现场
黄河老师首先对比介绍了各种编码格式的异同及区别,随后老师介绍了python中文件的读写与关闭,就其中的注意事项做了特别强调和说明,并带领在场师生一一做了练习。接着老师重点介绍了模块及相关语句,如import语句以及from…import…语句等。老师随后聚焦到nltk模块,并就nltk的相关用法,如分词,分句,词干提取,词形还原,词性标注,停用词的去除,词频统计等等一一做了详细的介绍。最后,老师以一本小说为文本,分析了文中某个词的同义词,文章常用的二词搭配,关心的词在文中出现的位置等等,并就其中的重难点和注意事项做了详细的解释。