Summary: 代码还有许多 优化的地方 Detailed Comments: 1、在读取数据集这一步,需要把很多空的数据集过滤掉; 2、停用词用一个文件存起来,不要放在代码中; 3、数据预处理部分,完成的不够,比如一些没有用的符号需要去掉等; 4、heappush需要导入,或者是heapq.heappush; 5、倒排索引的这部分还需要继续完成; 6、整体代码还是比较凌乱,需要整理一下; Overall Score: 78 -------------------------------------------------------------------------------------------------------------------------- Thanks for your efforts. -Your instructor