在“我爬了一万篇文章,告诉你AO3是个什么网站”一文中,大家对我的方法提出了很多意见,也有很多同学认为统计过于粗暴。在这个周末,我稍稍自学了一下 NLP ,采用TextCNN做了一个敏感句检测器,并将约600篇文章的敏感句摘录出来。希望能够通过这种方法给大家一个更加直观的感受。 Python环境:conda 4.8.2 Python 3.7.6 使用到的库和工具有: Blender 2.8.1 Jupyter Notebook selenuim BeautifulSoup jieba numpy opencv-python pytorch torchtext