主题网页的信息提取算法>提取DocView模型要素的方法

20 一月 2010
评论关闭

有主题网页的信息提取算法
该算法是一组启发式规则为指导,首先提取出网页的正文信息,然后以正文信息为基础,提取DocView模型中其他的要素。

主题网页DocView模型生成过程

正文:一篇有主题网页中的正文通常是用成段的文字来描述,中间通常不会加入大量的链接,而非正

文信息通常是伴随着链接出现的。由此形成的规则称之为正文选取规则(正文规则)。
正文规则:有主题网页中,如果一个内容块是topic类型的,则该内容块中的内容为正文的一部分。

依据正文规则,深度优先遍历标签树并以此记录topic类型的内容块,就看得到该网页的正文,也就

是该网页的主题内容。
关键词:关键词选取的依据是特征项的权值,因而特征项权值的合理计算是正确提取关键词的保证。

以标签树为基础,结合HTML网页的特点以及提出的量化方法,可以直接按照下述过程得到网页的主题内容的特征向量。

for标签树中的每个正文块CBi do
   if 该块中存在重要标签信息 then
     检查重要信息标签中的内容是否在噪声词集合中出现
     if 不在噪声词集合 then      //为真实重要信息
       将重要信息标签的影响因子累加到该内容块的影响因子上
     end if
     if 该内容块的影响因子大于 1 then
       提出的权值传递策略在标签树中传递权值
     end if
   end if
end for
计算各个特征项的权值

依据上面算法可以得到特征向量,可以用2种策略决定选取关键词的数量。

绝对数量策略:定义好DocView 模型中关键词的个数α,严格选取权值最大的α个特征项作为该网页的关键词。
相对数量策略:定义个一个阈值β,而后计算所有特征项权值的算术平均值avg,选取特征项中权值大于avg*β的作为该网页的关键词。该策略中不需要规定要选取的关键词的个数,直接依据特征项权值的绝对大小判断该网页的关键词。虽然会导致各个网页中被选取关键词的数量不均,但可以更准确地提取关键词。

内容类别:通过正文分类得到。网页的量化表示是网页分类过程中必不可少的阶段,而在关键词提取过程中已经得到了正文的特征向量,那么直接使用正文向量进行分类(节省网页量化过程的时间成本),这正是将共性需求一次提取的优势之一。仅对网页的正文分类有效的排除了噪声内容的干扰,从而提高了分类的准确性。

标题:HTML网页中,网页的标题由<title>标签标识。小部分网页是没有标题的,那么针对没有标题或者使用无描述能力(标题为类似”Untitled Document、Newpage、welcome、欢迎访问等的以网页制作工具新建网页的初始title作为title的网页或者没有title标签的网页”)的网页,从关键词集合中选取权值最高的作为网页的新标题。

网页类型的判断方法>提取DocView模型要素的方法>网页净化与消重>搜索引擎

11 十二月 2009
评论关闭

web上的网页,可以根据其网页类型可以分为三类:主题网页、Hub网页、图片网页。三类网页的信息提取算法各不相同,因此在对网页进行深入分析之前首先要判断网页的类型。

网页类型判断方法

视觉上,大多数网页是很容易区分类型的,因为三种类型的网页有着较为明显的视觉特征。
主题网页:通过成段的文字描述一件或者多件事物,虽然也会有图片和链接,但这些图片和链接并不

是网页的主题;
图片网页:通过图片体现网页内容,文字仅仅是对图片的一个说明,所以文字不多;
Hub网页:通常不会描述一件事物,而是提供指向相关网页的链接,所以Hub网页中链接密集。

视觉上判断网页类型的方法是非常容易的,但是计算机进行视觉分析,却非常困难。量化方法则可以在大多数情况下准确识别网页的类型。网站通常都是通过一定布局来表现内容的。网页设计师通常都是将重要内容布局在网页中间区域,比如上中下结构,头部(header)、内容区(content)、页脚(footer),头部一般为导航,页脚标注一些网页相关信息,内容区域才是重点。因此依据网页中间区域的内容判断网页类型是相对合理的,而网页内容的位置是标签树中等的内容块的属性记录下来。

在构造标签树时,依据内容块中词项数、图片数的比值以及内容块中词项数与anchor text中词项数的比值将网页中的内容块分为topic、hub和pic三个类型,基于内容块的类型,可以使用网页中间区域hub内容块包含的词项数与网页中间区域词项数的比值判断网页是否为hub类型,同理,使用网页中间区域pic内容块包含的词项数与网页中间区域词项数的比值判断网页是否为pic类型。

抽象表示>网页表示>网页净化与消重>《搜索引擎》

27 十一月 2009
评论关闭

网页表示

网页的表示是网页内容分析的基础,在网页内容分析过程中通常需要两个层级的表示,抽象表示和量化表示。
抽象表示是以网页制作规范(HTML规范)为依据和出发点,构造出能体现网页内容结构和内容重要性等信息的表示模型,其目的是充分利用网页制作规范,挖掘网页中隐含的信息,为后续量化表示提供更多可利用信息。
量化表示是指从计算机处理的角度出发,利用信息检索领域的技术和从网页中挖掘隐含信息,生成计算机可以直接用于计算的表示模型(如向量空间模型等)。
对于HTML网页,最常用的方法是构造网页的标签树。

抽象表示
HTML通过定义一套标签来刻画网页显示时的页面。
依据标签的作用可以将HTML的标签分为三类:
1、规划网页布局的标签:在视觉上,网页是由若干提供内容信息的区域(内容块)组成的,而内容块是由特定的标签规划出的(容器标签),而且容器标签是允许嵌套的。常用的容器标签有

1
<div>、<p>、<td>、<tr>、<table></table></tr></td></p></div>

等。因此依据容器标签可以把网页表示成树状结构,虽然树状结构描述的是网页内容的布局结构,但布局信息中隐含着网页内部各个部门内容的相关性信息。
2、描述显示特点的标签:在HTML标准钟定义了一套标签来规范其包含的内容的显示方式(文字大小、粗体、斜体),称之为重要信息标签。常用的重要信息标签有

1
<b>、<i>、<strong>、<h1>、<h2></h2></h1></strong></i></b>

等。这类标签中的内容通常是网页作者希望引起用户注意的。因此隐含着一定的内容重要性信息。
3、超链接相关的标签:超链接是HTML网页区别于传统文本的最明显的特点之一,表示着网页间的关系,因此整理出超链接标签并作合理的分析可以挖掘出网页间的内容相关性信息。

W3C HTML lexical analyzer(W3C 1997)与HTML Tidy(HTMLTdy 2004)
他们各有特点,W3C HTML lexical analyzer 有很强的通用性,适合各种标识语言;HTML Tidy则能够自动发现并修正标签的错误。二个都是构造标签树的工具。
由于内容分析需要在网页内部计算各个部分之间的相关性以及确定各个部分内容的重要性,因此用传统的顺序整理各种标签的方法构造出的标签树在用于内容分析时并不方便。适合内容分析的标签树强调内容块的概念,倾向于以内容块为单位的内容组织方式。
内容分析过程中通常关注这些信息:标签数的规模(结点个数)、每个内容快包含的类型信息(文本、超链或者图片)及其数量等。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
    < !DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
<title>Tags Model</title>
</head>
<body>
<div id="model 1">
  <ul>
    <li><a href="1"></a></li>
    <li><a href="2"></a></li>
    ... ...
  </ul>
</div>
<div id="model 2">
  <p><b>paragraph 1</b></p>
  <p>paragraph 2</p>
  <p>paragraph 3</p>
  <div>
    <ul>
      <li><a href="3"></a></li>
      <li><a href="4"></a></li>
      <li><a href="5"></a></li>
    </ul>
  </div>
</div>
</body>
</html>

2009-11-27 14-44-17

网页净化与元数据提取>网页净化与消重>《搜索引擎》

11 十一月 2009
评论关闭

网页净化与元数据提取

网页净化与消重是大规模搜索引擎系统预处理环节的重要组成部分。
网页净化(noise reduction):识别和清除网页内的噪声内容(如广告、版权信息等),并提取网页 主题以及与主题相关的内容。
网页消重 (replicas or near—replicas detection):去除所搜集网页集合中主题内容重复的网页。

在主题搜索领域,大量的广告、导航条等噪声内容会导致主题漂移(topicdrift)。这说明传统的主题搜索算法中以网页为粒度构造的web图不够准确,必须深入到网页内部将处理单元的粒度缩小,才能提高内容分析的准确性。在(Chakrabarti et al. 2001)中提出了一套解决方法,首先讲网页表示为一颗DOM数结构并找到与主题一致性较高的子树,然后对这些子树做特别的处理,从而提高主题的提炼的效果。

在web信息检索领域,检索结果的相关性和检索的速度是评价一个web检索系统的两个指标。如果不去除原始网页中的噪声内容,检索系统必然对噪声内容也建立索引,从而导致仅仅因为查询词在某张网页的噪声内容中出现,而把该网页作为结果返回,而网页的主题内容可能和这个查询词完全无关。可以看出,噪声内容不仅使索引结构的规模变大,而且还会导致了检索系统准确性的下降。针对这个问题(Lin et al. 2002)中提出了一个去除网页中噪声内容的方法,该方法首先依据<table>标签构造网页的标签树,从而依据<table>标签将网页规划为相互嵌套的内容块;然后对于使用同一个模块做出的网页集。找出在该网页中多次出现的内容,作为沉余内容,而在该网页集中出现次数较少的内容快就是有效信息块。实验证明该方法是有效的,但该方法必须局限于同一个模版的网页集,而web上的网页模版不计其数,该方法显然不够通用。

在网页分类领域,由于噪声内容与主题无关,训练集中的噪声内容会导致各个类别的特征不够明显,而待分类网页中的噪声内容则会导致改网页类别不明显,因而影响了网页自动分类的效果。(Yang 1995,Li et al. 2002)中提出了通过去掉网页中的噪声内容来提高网页分类质量的方法。

在网页信息提取领域,自动识别漠视的方法必须要从整个网页中提取模式,而不是只针对主题内容提取。因此,在净化后的网页上作信息提取不仅可以排除噪声信息对信息提取的干扰提高信息提取的准确性,而且可以使得网页中的结构简单化提高信息提取的效率

噪声内容对基于网页的研究工作室普遍而严重的,虽然各个领域采用的方法各不相同,但处理的目的都是为了去除网页的噪声内容,得到真正的主题内容

随着web上的研究与应用的发展,单纯的网页内容已经不能满足需求,网页元数据得到越来越多的广泛使用。在web检索领域,单纯依赖关键词匹配的检索手段过于单一。内容类别、摘要等元数据信息的合理使用,不仅使用户可以从不同的角度进行查询,而且也使得查询的准确性得到提高。而主题搜索、个性化信息服务以及数字图书馆也都强烈的依赖资源的元数据信息。因此,准确且高效的提取必要的元数据是web上各个研究领域面临的重要问题。

在元数据和主题内容的提取方法上,可以从信息提取领域的研究成果(特别是HTML网页中提取语义信息)中得到很多启发。针对从HTML网页中提取语义信息,早期的方法是:针对某一类具体网页,人工提取该类的网页中的内容组织模式。然后,信息提取系统根据该模式从属于该类的网页中提取相应的内容(Hammer et al. 1997,Ashish et al. 1997)。对元数据和主题内容的提取可以采用同样的办法,但这些方法有一个共同的局限性,那就是需要人工提取内容组织模式,这对于内容组织繁多的web来说显然是不适用的。因此,在(Wemble et al. 1999)中提出了5条启发式的规则,综合利用这5条规则系统可以自动地发现网页中各个主题信息块(chunk)的边界。(Yang et al. 2001)提出了一种基于视觉相似性来自动分析网页语义结构的方法,该方法首先比较HTML网页内容的视觉相似性,然后使用一个模式发现算法来确定这些视觉相似性的内容最有可能的组织模式,最后按照该模式将内容重新组合。

HTML_DocView模型
包括:网页识别、网页类型、内容类别、标题、关键词、摘要、正文、相关链接等要素。其中正文和相关链接属于网页的内容数据,而其他6项则属于网页的元数据。

网页类型:根据网页内容的表现形式进行划分,一般划分为三类,既 主题网页(topic)Hub网页(hub)图片网页(pic)

内容类别:是从语义上对网页的内容进行分类,它是计算机获取网页语义信息的一个直接手段。

标题、关键词、摘要:是概括描述web文档内容的重要元数据

正文:是原始网页中真正概括描述主题的部分

相关链接:是指在本网页中指向与正文内容相关的网页的链接

无果

27 十月 2009
评论关闭
无题

无题

你应该漠视,还是无视、
事实上,你完全忽略了别人的感受、

在你的心理,原本重要的一切变得不重要了、
原本在意的一切,都变得不那么在意、
原本期望的都是那么的无力、

或许,这应该是新生活开始的预兆、
你选择了离开、
是的,的确如此、

你放弃了期盼已久的生活、
你无视了在意你的人所做的一切、

的确,你的价值观发生了惊天的巨变、
你像着了魔一样发疯、

你心中唯一想做的,便是那样、
每每想到这里、
心就忍不住的痛,忍不住的难受、

为什么会落得如此情景呢?
难道新事物就真的那么有吸引力、
那么有动力?

你一次次的伤人、
置人于不顾为的就是这些吗?为什么呢?你的理性哪里去了?真的可以这样吗?

喜欢玩的人,请你走开

2 十月 2009
评论关闭

一场噩梦过后,才发现只是梦,
但往日那历历在目的横祸,又岂能如梦般消散,
数小时瞬变,十五分落定,
是静,是台?

一个女人,是不是应该邪恶到昧着良心骗人?
一个女人,是不是应该能让一个男人崩溃?
一个女人,也不过仅仅是一个女人而已,

可让人心痛,却只是为了一个四月半的感情。
一段扣人心弦的经历后,病魔缠身,
仅仅是以一个女人而已,
可又有谁能知解,
被骗的游刃有余,
被玩的支离破碎 ,

狂背后才发现,
原来只是自己心里作祟,
其实真相早已大白,
即便一味的骗自己,
却,骗不了自己的感觉,
骗不了自己的眼睛,

心中那份沉淀已久的感情,
被搁置了,
或许是被革职了,
仅仅是路人而已,

遥身观望,
却也只是他人玩物而已,
梦也,镜也,

狂乱烟圈过后,
却也只是,独愁、独欢

这是因为感觉吗?感觉带着自己被一次又一次的欺骗。

对不起,骗我的人,请你走开,甚至求你远离我。

2009.09.19 UPA专家论坛(深圳站):打造更有价值的用户体验团队

9 九月 2009
评论关闭

近几年来国内企业对用户体验越来越重视,一些先行企业在已经有的比较完善、相对成熟的用户体验团队,而也有些企业刚建立用户体验团队不久或者是刚刚打算设立某个用户体验相关工作岗位。有些用户体验团队栖身于开发或市场部门,有的用户体验团队自立门户成为与市场、开发等并列的部门。有些企业对用户体验工作进行统筹管理由统一、集中的用户体验团队负责,而有些企业把用户体验团队分散在各产品线进行具体负责。不同形态的用户体验团队正以不同方式为公司运营和产品竞争优势上的发挥着作用,处于不同发展阶段的用户体验团队也在面临各不同的机遇与挑战。

本次专家论坛将邀请业内用户体验团队建设经验比较丰富部门管理人员与大家分享他们这方面的经验和教训,并与与会者就如何根据公司文化、行业特性以及用户体验行业特点等因素推进所在用户体验团队的建立、发展与壮大,帮助与会者所在用户体验团队了解如何制定切实可行的发展路线,如何获得更多来自公司上层的青睐与其他部门的支持,如何平衡团队自身专业提升与达成企业经营目标等用户体验团队建设中必须面对的挑战。

举办时间:
2009年9月19日下午14:00~18:00

举办地点:
腾讯科技(深圳)有限公司培训室
深圳市南山区高新科技区中西区科技中一路华强发展大楼4楼

分享嘉宾(暂定):
腾讯用户研究与体验设计中心负责人
华为UCD管理部负责人
中兴通讯用户体验中心负责人
雅虎香港用户体验及设计部负责人

专家论坛日程:
13:30-14:00 签到
14:00-14:30 来宾介绍
14:30-15:30 如何建立用户体验团队
15:30-16:30 如何度过用户体验团队初期的半年
16:30-16:45 茶歇 中间休息
16:45-17:45 如何发展出具有核心竞争力的用户体验团队
17:45-18:00 总结

费用:
100元/人;9月13日前报名9折;UPA会员5折;学生5折

具体活动信息及报名网址:http://www.upachina.org/newevents/Cn/20090822/.aspx?event=15

UPAChina联系方式:
秘书处办公电话:86-21-61526484
活动邮箱:events@upachina.org
活动联系人:朱丹:13916152495

如果有机会

12 八月 2009
评论关闭

only me

如果有机会,我想我还会一如既往的追随
还会一如既往的做自己想做的事情

即便是错了,也不会因此而愧疚、后悔

至少我曾试过,也知道过了

如果有机会,我愿意用一切来换回曾经的完美
用一切来换回你我简单的生活

即便是枯燥,也不会因此而逃避、离开

至少我曾安逸,也知道足了

如果有机会,我想我还会选择多年前的你
还会选择那个性格刚烈的女人

即便是争执,也不会因此而支离、破碎

至少我曾爱过,也知道感情不是一个人的

我曾想就这样罢了
可生活却让我有了新念
一如既往的平静被简单的好奇彻底打碎
我们,只此而已

不知道什么时候开始,我抑郁了
我开始怀疑自己,怀疑自己曾经的追随,怀疑自己曾经的梦
不,
这不止是怀疑,是否定
或许更多的是 新

过了以后
我知道,原来选择的背后
支撑着的唯一看的到、感受的到
就是那可怜的冲动

如果有机会,我想我会回来
如果有机会,或许我还会选择

但,我不会因此而抱有一丝悔意

很无力,很匮乏

10 八月 2009
评论关闭

伤了心,何时能找回!
突然想起曾经那朝朝暮暮;
很奋力的去寻找多年前一位好友;
却发现,无论如何都无从下手;
很无力,却也很痴狂。

回想昔日,曾几何时
我们还是那么熟悉、那么相知

敌意、爱意似乎从来都没有被分开过;

想起了你,却也想起了过去的沟沟坎坎
想起了你,心中仍是那么放不开
想起了你,再次让我陷入沉沦

不,我不需要再为此痴狂
混乱中我一直告诫自己

不,我不需要再为此痴狂
我们都太年轻

心中不知是什么指使
却忍不住心酸、心碎

很想、很想,但也知道
那人仅存己心中

念,思,苦,痛
最后还是默忍、默认

命亦,足亦

总是告诉自己,这就是
你得接受
痛苦中实难分辨
我到底在挣扎什么?

流量是网站经营的结果和对象

30 七月 2009
评论关闭

mainBanner_anys

流量既是网站经营的结果,也是网站经营的对象。

流量的获得、派生、过滤、保有、转化,是网站经营的关键,每个环节的生产率都需要监控,根据每个环节的目的反复进行针对性的优化。

一.流量的获得——原生流量和派生流量

网站经营者既要按自己的资源和欲望规划好基础的原生流量,又要事先规划好派生流量产生的条件和路径。如果没有事先规划原生流量和派生流量的来龙去脉,计划可以认为是不够充分的。

三.流量过滤——自觉与不自觉,无所不在的过滤

1.流量过滤的意义

网站的流量来源、界面组织、信息结构、服务深度等,无处不在自觉或不自觉地过滤访客,动态地形成访客结构。访客结构对网站发展的影响不言而喻。

访客过滤不仅仅影响访客结构,还影响网站的服务资源。如果进入网站的流量属于符合商业目标的较高价值流量,网站就可以更针对性地以更高代价提供更好的服务和营销,而不会把资源浪费在低价值的访客身上。

网站一方面要清楚了解和反复检讨自己在哪些角度自觉或不自觉地进行了访客过滤,长远影响如何,另一方面要根据自己的商业目标来主动调节访客过滤。

2.从源头进行过滤

从搜索引擎竞价广告或SEO来的访客,通过关键词产生了过滤作用。尤其值得注意的是相关关键词或短句的长尾效应,当网站具有大量高相关内容时,可能会无心插柳地获得分散的相关关键词或短句检索流量,不但价值可能比内涵宽泛的热门关键词高,而且合计量不小。因此主题相关内容的积累和更新是一个很重要的工作。

软文能带来高质量的访客,而且由于转载,可以实现良好的品牌效果和流量效果。笔者认为软文是最好的流量来源之一,用一笔钱做广告,不如用同样的钱找人写软文,将文章发得昏天黑地。

插件广告很流氓,但技术上可以实现很好的过滤性,可以根据访客打开的目标网站或者是检索的关键词而针对性弹出。如果要做付费广告,这是一个很好的选择。

派生流量,也就是访客通过口碑方式带来的流量,是高价值的流量。创造派生流量的模式和技巧,是一个过去缺乏精细研究的领域,很值得深入探讨。有兴趣一起探讨的请联系笔者。

包月广告、联盟广告、友情链接、邮件传播等,靠文字表达进行流量过滤。如果广告内容做得过于宽泛或偏颇,将带来大量无价值流量,要通过测试不断调整。

3.通过界面气氛过滤

界面形式,就象酒店和大排档的环境一样,通过访客认知“这是合适我的地方”,而对访客进行着过滤。美观或粗陋、简洁或花哨、易用或复杂、热闹还是平和,并非只有一个追求方向,而是视乎目标客户的层次、心理而定。猜测客户怎么需要不一定是对的,将之交给美工、策划的个人审美更是冒险,比较理想的做法还是测试,例如将多组界面,虚拟多个网站进行测试。

界面气氛的规划,有两个方面特别重要。第一个方面是人气体验,即感觉到与其匹配的人群富集及活跃于此站,这对于新站而言尤其有价值。就象超市故意把商品弄乱,饭店安排客人先坐外面一样,由于新访客接触到的信息是有限的,人气体验的创造颇有空间。第二个方面是行为暗示,暗示本站的服务适合何种人群、需要访客进行何种行为。例如中国交友中心无处不在暗示这是一个付费交友站,付费的效果很好,很多人付费,从而过滤了愿意付费的人群,并促进其付费行为。

4.信息呈现的过滤

这一点,我体会不是很清,只隐约感觉到在网站设计之初,就应从访客利益角度考虑信息呈现方式会对其带来的影响。要有这样的洞见并不容易,需要积累或对比。希望以后有机会通过一些具体的案例来深入。

5.服务的过滤

服务的设计并非一切以访客之利益、体验为目标,也可能要考虑如何过滤访客的因素,不在目标之内的访客,应让他不自在,尽快离开。

例如在注册环节,某些严肃交友站就通过繁复的注册和验证将严肃交友意向不是很强的访客过滤掉,留下的是容易收钱的一批,可以为他们提供更高品质的服务。

通常我们作为增加网站粘度的工具——积分,也具有过滤访客的能力。管理学上说“想要什么就奖励什么”,什么行为是你认为高价值访客应该拥有的,你就为该行为奖励积分,而不要雨露均沾,给低质量访客任何粘性。

四.流量保有——习惯的创造

高价值流量的获得和过滤,成本很高,让你的网站成为这个流量钟爱或信任的品牌,甚至成为他/她习惯的去处,比获得流量更为重要。如果你做不到,那么就象用漏水的桶打水,时间越长,漏的越多,白浪费。我经常奉劝想大规模做推广的朋友,先测试了你的回头率和口碑派生率再说,数字不满意之前,别做推广,先整好产品和服务。

是不是有了好的产品和服务,访客就会一来再来使用呢?未必!访客太忙,太多事儿,虽然感觉不错,未必想到再来一趟,更别论形成习惯。就象我们小时候一样,习惯的形成,是要人督促的。还可以举另一个例子,日久生情,你得经常在他/她面前出现、互动。如何不令人反感地引导访客一来再来,最终形成行为习惯或品牌依赖,是网站运营中的一个关键环节,值得下大力气去做。

以前听过一个说法,一件事情连续做21天就会形成习惯,不知道真假,但起码可见习惯的形成不是一次两次就可以的。有些网站过段时间就提醒你一下,你有好些时间没来了,有些网站过段时间给你提供一些与你有关的资讯,但这样够吗?从推动习惯的角度,我们不只是要提醒,更是要促使其行为的重复发生,因此接触的角度应该是发生式的,而且频度应该先紧后松,而不是松松垮垮。我想到销售人员常用的一个技巧,就是一次不把资料或信息给足,为下次联络创造机会。在网站的服务设计上,也可以使用类似的技巧。

五.流量转化——推动行为的发生

曾谈到:在传统商业中,故意削减客户体验的例子到处都是,访客体验优化的中心是:围绕经营目标,推动发生变化。强调的不是“体验”,而是“发生”。

怎么推动发生?

没有经验的销售人员跟客户可以谈得情投意合,就是无法推动销售的发生,也不知道客户是否打算现在交易;有经验的销售人员很容易创造一个“咱们来交易吧”的情境,与客户一起自然地走入交易,或者快速识别暂时不会发生交易的客户。

网站设计也是如此。有经验的和没有经验的组织,在推动访客行为发生方面有着巨大的差异。笔者以为,销售技巧中的很多内容,可以搬到网站流量转化中。如果策划人员和设计人员进行一下销售技巧方面的进修,可能会有很大的好处。

六.总结

对流量的经营,核心是对客户利益、心理和行为的分析,必须对该领域的行业和客户有深入的理解。在任何一个服务方向,这都是一个需要长期积累才能做好的工作。对于一个网站来说,这样的人才是至为宝贵的,挖来一个,少走N年弯路,节约无数投资。换一个角度,如果你对某个领域感兴趣或有积累,最好就一直积累下去,直到成精,不要轻易切换。对客户的理解是所有能力中最值钱的能力。

流量经营是需要数字监控的。如果是我的网站,我会在流量的获得、派生、过滤、保有、转化各个环节放置监测代码,检测各环节的生产率和损失率,并长期做纵向对比;并且,在资源许可下,在关键环节多做不同角度的优化模拟测试。

在这样的优化及监测基础上,就可以做比较准确的规划,按目前能力可以实现怎样的目标,如果要提高目标,需要在哪些环节做怎样的投入。许多网站的经营如同黑箱,只能看到总投入和总产出,分解不出每个环节对结果的影响,有点靠天吃饭的味道。笔者认为,这是作坊式的,不适合规模生产。
来自:CHINA UED

下一页 »