Skip to content

AmuroPeng/Document-Indexing

Repository files navigation

Document-Indexing

面向英文文献的编辑与检索

1.1问题描述

设计英文文章的编辑与检索系统。编辑过程包括创建、打开、保存、查找以及替换等功能;实现文件的编码与译码;在一定规模的英文文献数据上,建立倒排索引,按照关键词进行检索,并输出结果。

1.2基本要求

1.2.1 图形界面

设计图形界面,可以实现英文文章的编辑与检索功能。

1.2.2 编辑过程

创建新文件;打开文件;保存文件。

查找:输入单词在当前打开的文档中进行查找,并将结果显示在界面中。

替换:将文章中给定的单词替换为另外一个单词,再存盘等。

1.2.3 编码功能

对于给定的文章片段(30<单词数量<100),统计该片段中每个字符出现的次数,然后以它们作为权值,对每一个字符进行编码,编码完成后再对其编码进行译码。在图形界面中演示该过程。

1.2.4 词频功能

对于给定的多篇文章构成的文档集中,统计不同词汇的出现频率,并进行排序,在界面中显示TOP 20的排序结果。

1.2.5 倒排索引功能

对于给定的多篇文章构成的文档集中,建立倒排索引,实现按照关键词的检索,并在界面中显示检索的结果(如:关键词出现的文档编号以及所在的句子片段,可以将关键词高亮显示)

感谢小飞云云等大神的帮助!!!

About

面向英文文献的编辑与检索(数据结构与算法课设)

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages