搜索引擎的工作原理可分为三个过程:首先在互联网中发现、搜集网页信息 , 其次对信息进行提取和组建索引库 , 最后再由检索器根据用户输入的关键词 , 在索引库中快速找到文档 , 进行文档与查询的相关度评价 , 对输出的结果进行排序 , 并将查询结果呈现给用户 。
搜索引擎不能真正理解网页上的内容 , 他只是机械地匹配网页上的文字 , 而真正意义上的搜索引擎通常指是收集了互联网上几千万到几十亿个网页并对网页中的每一个字进行索引 , 从而建立索引数据库的全文搜索引擎 。
典型的搜索引擎由三个模块组成:
1、信息采集模块:信息采集器是一个可以浏览网页的程序 , 它在进入到一个网页后会把该网页的链接作为浏览的起始地址 , 把被链接的网页获取过来 , 抽取网页中出现的链接 , 并通过一定的算法决定下一步要访问哪些链接 。
2、查询表模块:查询表模块就是一个全文索引数据库 。
【数据库索引的原理 索引的原理】3、检索模块:检索模块是实现检索功能的程序 , 其作用是将用户输入的检索表达式拆分为具有表达意义的字或者词 , 通过一定的算法获得相应的检索结果 。
推荐阅读
- 描摹的近义词是什么 描摹的近义词
- 西湖的面积 西湖的面积大约多少平方米
- 读爱的教育心得体会1000字 读爱的教育心得体会10篇
- 等差数列的前N项和公式是什么? 等差数列的前n项和公式 是什么?
- 鲜卑人是现在的什么族人?
- 梦到豹子到家里来了梦见躲避豹子 梦到豹子 梦见豹子的预兆
- 碾碎的拼音 碎的拼音
- 怎样查wifi密码是多少 wifi的管理员密码是什么
- 蚕的部首 餐的部首
- 神兽金刚的主题曲是什么叫什么名字?