主要中文搜索引擎浅析

主要中文搜索引擎浅析


来源:网络  作者:佚名

 

搜狐(Sohu)


    搜狐是根据中国人的文化传统为中国用户度身设计推出的网络分类式搜索引擎。它的出现,填补了国内互联网发展的一项重要口白,极大的方便了中文用户。"出门靠地图,上网找搜狐"在1998年年初曾经成为中文网上世界的一句口头禅。随着搜狐信息内容的不断丰富,技术力量的不断完善,搜狐吸引了越来越多的用户。搜狐分类搜索区拥有近5万个中文网页链接,进行一般搜索时速度很快,质量也不错。不过,它的内容不能算是很多,而且其中又有不少个人主页。

    搜狐采用了树型结构来对站点进行层次式分类。根据相应的网页内容,将所有的网页分为地区类、工商经济类、计算机与互联网类、教育、艺术、科学与技术、旅游与服务等18个类别,然后在18类别下面又分成几百个小类,如地区类下面的北京、上海等30个省市。在每一个小类下面又分为许许多多的子类,子类下面又分成许多…..如此等等,因为分类搜索引擎符合人们研究事物的过程,所以许多搜索引擎采用了这种方法。

    在关键字查询方面,搜狐提供了简单的机器自动搜索功能,只需要输入与所关心的主题有关的文字,搜狐会自动地在全部目录中,利用全文查询的方法找到相关的网页。

网页登记:

    1、确定您的网站是否已经登录在搜狐中
         
为保证网站登录、修改成功,请您务必确定您的网站是否已登录sohu。您可以使用sohu检索系统,也可以浏览搜狐相关类目来确定您的网站是否已登录在sohu中。
        如果你的网站没有登录在sohu类目中,而您希望登录,请填写“网站登录”表格。
        如果你的网站已经登录在sohu类目中,而你想修改登录的资料,请填写“网站修改”表格。
        如果你的网站已经登录在sohu类目中,而你想删除网站,请填写“网站删除”表格。

     2、“网站登录”使用说明
         进入“网站登录”页面后,您可以按提示选定最适合您的网站的类目,填写登录信息。
        网站登录的关键步骤是选定最适合您的网站的类目。选定适合类目可以加快搜狐处理网站登录的速度,登录成功后可以方便用户查询。
        如果您的网站内容涉及范围较广,请您依据网站的主要内容选定类目。
        如果您登录的网站网址、内容以后发生了变化,请及时填写"修改已登录的网站"。     
        如果一个网站连续15天无法连接,sohu将会删除该网站。 
     3、搜狐中文检索系统引擎会根据分类类目及网站信息与关键字串的相关程度来排列出相关的搜狐中文类目和

 

 

新浪(Sina)

   

      新浪网搜索引擎是面向全球华人的网上资源查询系统。提供网站、中文网页、英文网页、新闻、软件、游戏等查询服务。网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。目前共有14大类目录,一万多个细目和二十余万个网站,是互联网上最大规模的中文搜索引擎之一。

网站登陆、修改及删??

    1、首先判断您的网站是否已在新浪搜索中有记录: 使用新浪搜索的查询功能查找您的网站的 URL或名称,若您的网站已收录在新浪搜索中,(经过身份确定后)可以进行修改或删除操作。如果新浪搜索尚未收录您的网站,您就可继续进行登录新站的第二步了。
    
    2、确定您网站在新浪搜索中的所属目录: 新浪搜索现在由十四个主要目录组成,包括:娱乐休闲、电脑网络、体育与健身、商业经济、社会与文化、科学技术、生活服务、医疗健康、文学艺术、新闻媒体、社会科学、教育就业、政法军事、参考资料等。每个主目录又有很多子目录,通过浏览新浪搜索的目录或使用新浪搜索的目录查询确定您网站在新浪搜索中的所属目录。
    
    3、填写登录新站表格: 进入您网站所属目录页,点击页面右上角"登录新站"超链接,仔细填写您的网站名称、网址、网站简介和联系人姓名及电子邮箱等记录。
注意:登录网站时所用的联系人姓名和联系人电子邮件作为您日后是否有修改或删除该网站权限的唯一身份认证,因此一定要认真填写。
    至此,登录新站过程完毕。通常在3个工作日内,新浪搜索的编辑人员就会处理完您的登录请求,并给您发电子邮件通知您的网站是否被收录的结果。
    
    新浪搜索的检索结果是根据与查询要求相匹配的结果的质量来进行排列相关的分类目录和网站。质量越高,排列位置越靠前。
    其中新闻检索的结果是按日期排序,日期越新的新闻排列位置越靠前。

 

悠游(Goyoyo)

    

    这是一个急具高度智慧的搜索引擎,可随时带你常有全球40万个中文互联网网页,自动为您转换繁、简体字,让你悠游其间,乐也融融! Goyoyo的分类主题包括人物、电脑网络、生活资讯、衣食住行、工商企业、艺术、政治、环保公益、自然科学、医药保健、社会、人文科学及教育等十四个主项目及其下的各类分项。 Goyoyo的信息搜索方式分智慧型搜索和匹配型搜索。

网站登陆:

    您所提供的资料将是其它用户查找的重要依据,请您一定认真填写好每一项。
    
    如果您的网页提供多种汉字代码的用户界面,请选择一个您认为最应该向大家介绍的那一个。Goyoyo目前不鼓励加入纯英文的网站。
    
    您可以按需要填写作者与电子邮件一栏,这样Goyoyo将在显示你的网站的同时显示你的姓名与电子邮件地址。
    
    检索关键词与内容简介也请尽量详细填写,这可方便其他用户查找。      

    由于Goyoyo要对所有的中文文字进行词的切分与词性分析,系统只对常用的名词、动词、专用名词和人名进行处理,对其它的字词都将乎略,所以当您在本站查询时发现您的产品名称、公司名称或姓名常常被不正确地切分,在填写这个表格时,请用两个英文的~号将这些不常用的词标出,这样,系统将不对两个~号之间的文字进行处理,而保持其原有的状态。注意,为了不影响中文的正常显示,这一方法仅适用于关键词与作者姓名,在标题与内容简介中并不适用。特别要注意,这一方法不要滥用,不要将较长的字串置于两个~号之间。因为只有当其他用户完整地输入这些词时您的网站才能被查到,所以如果您限定的字串太长,将不会有人能完整地输入,其他人就无法查到您的网站了。以下是几个例子:
    ~涤纶薄膜~,~非银盐胶片~,~华光~,感光材料

    您所填写的内容在查询时所起的作用是不同的。标题中出现的词优先级最高,内容简介中出现的词优先级最低,关键词与作者姓名居中。有些非常重要的词并不适于出现在标题与内容简介中,所以建议您将它们填在关键词一栏。

    特别注意:请您将您的网站登录到合适的目录之内,否则其他网友就不能方便地找到您的网站。

排名情况:

    悠游中文引擎根据先进的词语主题关联分析技术来处理您输入的 字,词,句 ,按照网页(网站)与查询请求的相关程度来排列出相关的 网页,网站。相关程度 越高,排列位置越靠前。当然,我们所说的排列 顺序是根据电脑的逻辑运算做出来 的,最大程度的接近我们所理解的精 确度,但由于相同的语句对于不同的人来说可 能会有一些差异,因此我 们这里所提到的相关程度仅仅作为您的一个参考。
    
    影响相关程度的因素有:
    匹配到的关键词的多少。
    关键词在页面中出现的位置。如是否在标题中出现等。
    关键词在页面中出现的频率。频率越高,相关程度愈高。
    关键词本身的词义和系统定义的权值(相关程度)。权值越大,相关程度越小。

 

 

Google中文

    

    Google采用新一代的先进技术,根据互联网本身的链接结构对相关网站用自动方法进行分类,为您的每一个查询迅速提供准确的结果。Google以其独树一帜的网页级别 (PageRankTM,已申请专利)技术,打破了传统网络分类概念,带来网络搜索的革命。Google搜索速度极快,而且准确率极高。

    Google可贮存网页的快照,当网页服务器暂时中断时您仍可浏览到该网页的内容。若找不到服务器,则Google暂存的网页也可救急。从贮存网页快照中找寻资料要比常规链接快得多,尽管所获取的信息可能不是最新的。而且在很多情况下可免受"404 Not Found Error"(找不到网页的错误信息)之苦。

网站登陆:

    Google经常在网上漫游,搜寻新资料。Google也可以让您提供新的网站信息。但Google会分析网站内容,所用时间长短不一,用以决定网站信息是否使用。首先输入网址,包括前缀http://,如http://www.google.com/。还可以加上网站简介,但此项说明仅供Google内部参考,并不影响Google对网页的编排。
    如果您的网页提供多种汉字代码的用户界面,请选择一个您认为最应该向大家介绍的那一个。Goyoyo目前不鼓励加入纯英文的网站。
    
    注意:登录网址时,只须提交最上层的网页,其他各页由Googlebot自行查找。Google会定时自动检索并更新所有网站;对于失效网页则将其删除。

关于排名

    作为组织管理工具,网页级别利用了互联网独特的民主特性及其巨大的链接结构。实质上,当从网页A链接到网页B时,Google就认为"网页A投了网页B一票"。Google根据网页的得票数评定其重要性。然而,除了考虑网页得票数(即链接)的纯数量之外, Google还要分析为其投票的网页。"重要"网页所投之票自然份量较重,有助于增强其他网页的"重要性"。

    重要的、高质量的网页可获得较高的网页级别,从而在搜索结果中可获较高的排位。这样,Google的重要性综合指标为网页级别,而不是根据某一个具体的查询。当然,这代表了该网页本身的特性,是由Google根据网络数据、采用评定链接结构的综合运算法则进行分析的结果。

    当然,如果与查询项目不匹配,再重要的网页也毫无意义。因此,Google采用完善的正文匹配技术,为您查找既重要又准确的网页。例如,Google在分析一个网页时,还会同时参考指向此网页的链接描述。

    与其他多数搜索引擎的区别在于:Google只显示相关的网页,其正文或指向它的链接包含您所输入的所有关键字,而无须再受其他无关结果的烦扰。

    Google不仅搜索出包含所有关键字的结果,并且对网页关键字的接近度进行了分析。与其他多数搜索引擎的一大区别是:Google按照关键字的接近度区分搜索结果的优先次序,筛选与关键字较为接近的结果。


·上一篇文章:主要英文搜索引擎探索
·下一篇文章:百度关键词竞价价格查询


转载请注明转载网址:
http://www.jmkt.cn/html/search/134001770.htm


相关内容