主站首页 | 加入收藏 | 帮助中心 |   频道切换
上载相片 1
用户名:我爱北京
昵称:天安门
职业:被人的老公
城市:杭州
设计专长:商业建筑类
喜用颜色:#33333
设计收费:8000$
统计信息
作品数:共2(幅)
项目数:共1(套)
人气值:1
活力值:3
登陆次数:123 (次)
好友数:0(个)
文章数:共1(篇)
点击率:3262(次)
最近登陆:12月11日 15:05


垂直搜索
作者:yinuo 时间:2006-10-28 9:20:28 阅览:0
    垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
   垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。
  整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。
    垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。
    举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。
   垂直搜索引擎大体上需要以下技术
    1.Spider
    2.网页结构化信息抽取技术或元数据采集技术
    3.分词、索引
    4.其他信息处理技术



   垂直搜索引擎的技术评估应从以下几点来判断
    1.全面性
    2.更新性
    3.准确性
    4.功能性
  垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。
室内设计师网-浙江装饰网旗下网站  © 2001-2009 All Rights Reserved. Tel:0571-56850878 QQ:19503189
本栏目关键字:杭州室内设计师、杭州室内设计师网、浙江室内设计师网、杭州室内设计培训、杭州室内设计公司