书签 分享 收藏 举报 版权申诉 / 7

类型基于眼动数据的网络搜索行为预测方法.pdf

  • 上传人:xbp2015
  • 文档编号:71552722
  • 上传时间:2019-05-06
  • 格式:PDF
  • 页数:7
  • 大小:1.41MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    基于 数据 网络 搜索 行为 预测 方法
    资源描述:
    2 0 1 5 年5 月 第4 1 卷第5 期 北京航空航天大学学报 J o u r n a lo fB e i j i n gU n i v e r s i t yo fA e r o n a u t i c sa n dA s t r o n a u t i c s M a y2 0 1 5 V 0 1 4 1N o 5 h t t p :b h x b b u a a e d u e nj b u a a b u a a e d u c n D O I :1 0 1 3 7 0 0 j b h 1 0 0 1 5 9 6 5 2 0 1 4 0 4 6 4 基于眼动数据的网络搜索行为预测方法 卢万鼗,贾云得+ ( 北京理工大学计算机学院,智能信息技术北京市重点实验室,北京1 0 0 0 8 1 ) 摘要:预测用户的网络搜索行为对改进搜索引擎和提升用户体验十分重要现有 大多数方法是基于用户的交互数据,如查询、点击和鼠标移动等提出一种基于眼动数据的用 户网络搜索行为预测方法通过眼动实验,采集用户在网络搜索任务时的眼睛运动数据,将这 些数据转化成两种数据格式:直方图和序列直方图数据描述用户注意力的分布情况,序列数 据呈现用户的扫视路径使用4 种学习算法对用户决策或用户意图进行预测,同时研究两种数 据格式的性能结果显示,两种数据格式均适合于预测用户决策,而序列数据更适合于预测用 户意图该结果表明,利用眼动数据能够有效预测网络搜索行为 关键词:用户行为预测;网络搜索;眼动数据;用户决策;用户意图 中图分类号:T P 3 9 1 文献标识码:A文章编号:1 0 0 1 5 9 6 5 ( 2 0 1 5 ) 0 5 - 0 9 0 4 - 0 7 网络已经成为人们获取信息的主要来源,网 络搜索是用户在网上获取信息的重要手段理解 用户如何进行网络搜索,不但能够改进搜索引擎, 而且能够帮助设计更为人性化的人机交互方式, 从而提升用户体验因此,网络搜索行为研究已经 受到学术界和工业界的广泛关注,尤其是网络搜 索行为的预测研究 近年来,有学者基于视觉行为与人的思维密 切相关的基本事实,利用用户的视觉行为数据预 测其网络搜索行为例如将视觉行为作为隐变量 进行处理1 ,或者利用鼠标的移动代表用户目光 的移动。0 | 隐变量方法是一种从概率的角度对 用户的视觉行为进行估计的方法,适用于群体行 为预测,不能用于个体行为预测鼠标移动是对用 户目光移动的一种粗略估计,在一些情况下是不 准确的例如,用户只在需要的时候移动鼠标,即 偶发式鼠标用法。“,显然,此时鼠标移动不能 用来估计目光移动一种更好地表示用户目光移 动的方式是使用眼动跟踪技术,该技术能够捕捉 用户在进行阅读、浏览和搜索等视觉行为时眼睛 的运动数据( 眼动数据) ,例如目光停留的位置和 持续的时间眼动数据已经广泛应用于许多研究 领域,例如隐式关联反馈、决策因子提取“、 推荐系统“、人机交互叫和高层次上下文识 别1 等但是国内外将眼动数据用于预测网络搜 索行为的研究还很少见 本文主要研究基于眼动数据的网络搜索行为 预测方法随着眼动仪不断向智能化和便携化方 向发展,眼动数据将与目前普遍使用的点击数据 和交互数据一样,成为分析和预测用户网络搜索 行为的重要反馈信息因此,探索如何利用眼动数 据预测用户的网络搜索行为是十分必要的 1 网络搜索行为预测相关研究 许多学者对用户的网络搜索行为进行建模和 预测其中,一些研究分析用户的点击数据m3 | , 收稿日期:2 0 1 4 - 0 4 - 2 8 ;录用日期:2 0 1 4 - 0 8 - 0 1 ;网络出版时间:2 0 1 4 1 2 1 11 8 :0 9 网络出版地址:w w w c n k i n e t k c m s d e t a i L 1 1 2 6 2 5 V 2 0 1 4 1 2 1 1 1 8 0 9 0 0 1 h t m l 基金项目:高等学校博士学科点专项科研基金( 2 0 1 2 1 1 0 1 1 1 0 0 3 5 ) 作者简介:卢万最( 1 9 8 6 一) ,男,北京人,博士研究生。l u w a n x u a n b i t e d u c n + 通讯作者:贾云得( 1 9 6 2 一) ,男,山西大同人,教授,j i a y u n d e b i t e d u c n ,主要研究方向为计算机视觉、人机交互和智能系统等 B l 用格式:卢万最。贾云得基于眼动数据的网络搜索行为预测方法【J 1 北京航空航天大学学报,2 0 1 5 4 1 ( 5 ) :9 0 4 9 1 0 L uwx ,J i aYD ,P r e d i c t i n gw e bs e a r c hb e h a v i o rb a s e do ng a z ed a t af JJ J o u r n a lo fB e i j i n gU n i v e r s i t yo fA e r o n a u t i c sa n dA s t r o n a u t i e s ,2 0 1 5 ,4 1 口) :9 0 4 9 1 0 ( i nC h i n e s e ) 万方数据 第5 期卢万赧,等:基于眼动数据的网络搜索行为预测方法 9 0 5 另一些研究使用更为丰富的交互数据1 L e e 等通过用户研究对如何自动识别查询 目标进行调查,发现多数查询存在可预测的目标, 由此提出了基于用户点击行为和文本链接分布的 查询目标自动识别方法L i 等。介绍了一种基于 点击图的查询意图分类方法,该方法利用半监督 学习和点击图生成大量的训练数据,从而提升分 类器的性能S h e n 等。3 1 使用稀疏隐动态条件随机 场,为每一类用户意图学习一个子结构;这些子结 构用来建模如计划旅行、购物或者娱乐等用户意 图和用户的点击行为之间的动态特性 有研究表明,引入更为丰富的交互数据能够 显著提高网络搜索行为预测的结果A g i c h t e i n 等H 。利用建模用户行为的方式,对网络搜索结果 偏好进行预测他们发现,基于查询文本特征和浏 览特征等交互数据的预测方法要好于基于点击数 据的预测方法H a s s a n 等5 1 在建模用户行为时, 考虑到查询、点击、驻留时间和查询重构等描述用 户整个搜索过程的数据通过这种方式所生成的 用户模型能够更好地判断用户是否成功完成搜 索M o s h f e g h i 和J o s e o 从认知、情感和交互的角 度对网络搜索的特点进行研究,发现不同搜索任 务之间存在明显的差异他们利用机器学习方法, 从用户的交互数据中学习用户模型,从而大幅提 高预测搜索任务类型的正确率 交互数据( 或者说用户日志) 能够在一定程 度上描述用户的搜索过程,但W a n g 等1 提出,用 户日志只记录了能够被观测到的用户行为( 例如 点击和查询重构等) ,用户浏览搜索结果的过程 是无法通过分析日志文件获得的;他们报告了一 种部分可观测马尔科夫模型,将用户阅读和跳过 搜索结果的行为作为隐状态处理,其模拟的用户 浏览模式与眼动实验的结果高度一致,从而证明 了模型的有效性G u o 和A g i c h t e i n 1 尝试用鼠标 移动数据来推断查询意图,结果显示基于鼠标移 动轨迹的查询意图预测方法要好于基于点击数据 的方法;此后,他们将鼠标移动数据加入到用户行 为建模中,以便分辨用户意图和预测广告点击行 为p 1 A r g u e l l o 引调查多种不同特征在预测搜索 任务难易度时的作用,得到鼠标移动数据在预测 首次查询的难易度时具有较好性能的结果 与上述研究不同,本文使用眼动数据来预测 用户的网络搜索行为相对于隐变量方法7 1 和鼠 标移动方法1 ,眼动数据能够精确反映用户的 注视信息,得到的用户视觉行为可以认为是“真 值”而不是估计值 2 眼动实验 实验要求被试完成预定义的网络搜索任务 被试的眼动数据用非接触式眼动仪记录,共获得 11 8 3 个搜索任务、2 86 1 3 个注视点的眼动数据 2 1 实验任务 实验使用两类搜索任务( 表1 ) :导航类和信 息类导航类搜索任务旨在找到特定网页;信 息类搜索任务旨在找到特定信息,该信息可能出 现在许多网页中每名被试完成2 0 个任务,导航 类和信息类各1 0 个全部任务的搜索目标和搜索 词均为预定义的,并且搜索引擎结果页面( S e a r c h E n g i n eR e s u l t sP a g e ,S E R P ) 均保存为本地H T M L 文档,以保证每名被试面对相同的S E R P 表1 搜索任务示例 T a b l e1 E x a m p l e so ft h es e a r c ht a s k s 2 2 实验被试 有偿招募被试8 1 人,其中,4 人由于眼动仪 校准问题或系统故障没有完成实验,1 7 人的眼动 数据采样率相对较低( 低于5 0 ) 为保证数据质 量,只选取6 0 人的眼动数据,其中3 0 人为女性 这6 0 名被试均为来自同一所大学不同专业的本 科生和研究生,视力正常或矫正视力正常,没有如 色盲等眼睛问题被试年龄在1 8 3 1 岁之间( 均 值为2 3 9 岁,标准差2 ,5 岁) 2 3 实验设备 实验使用瑞典T o b i i 公司的T 1 2 0 型眼动仪 该眼动仪配有1 7 英寸( 1 英寸= 2 5 4c m ) 显示 器,采样率为1 2 0H z ,精确度( 视角) 为0 5 。实验 中将显示器分辨率设为10 2 4X7 6 8 像素,放置在 距离被试约6 0c m 的位置被试的眼动数据由眼 动仪自带软件T o b i iS t u d i o 记录实验在配有I E6 浏览器和W i n d o w sX P 操作系统的计算机上完成 2 4 实验过程 实验开始前,对每名被试用9 点校正法校正 眼动仪,并以文字形式向其介绍实验内容;然后, 被试进行一组练习以熟悉实验流程 每名被试完成全部2 0 个搜索任务,任务之间 有短暂的由被试控制的休息时间对每一个搜索 任务,屏幕上会以文字的形式向被试说明搜索目 标被试记下该目标之后点击“开始”按钮进入含 有预定义搜索词的搜索引擎页面被试不允许改 变搜索词,直接点击“搜索”按钮进入S E R P ( 这种 万方数据 9 0 6 北京航空航天大学学报2 0 1 5 年 从搜索引擎页面到S E R P 的方式更符合被试在日 常生活中的实际情况,因此其眼动数据更为真 实) 每个S E R P 中均含有1 0 个搜索结果,一些 S E R P 中还含有顶部广告被试需要浏览S E R P 并 点击最符合搜索目标的某个搜索结果或者顶部广 告,以完成搜索任务全部搜索任务完成之后,被 试需要填写有关其背景信息的调查问卷每名被 试实验耗时约3 0m i n 3 预测方法 通过眼动实验,采集到用户在网络搜索任务 时的眼动数据这些数据能够以“注视点”的形式 导出,每个注视点包含许多数据项本文只使用其 中的5 个数据项:时间戳( 注视点发生的时间) 、 注视时间( 注视点持续的时间) 、横坐标、纵坐标 和刺激名称( 注视点所属网页的名称) 这些原始 的眼动数据将转化成两种描述被试注视模式的数 据格式:直方图和序列这些转化后的数据配合学 习算法,用来对用户行为进行预测 3 1 数据转化 首先,依照刺激名称剔除属于S E R P 之外的 注视点其次,由于S E R P 中的注视点主要落在1 0 个搜索结果和顶部广告上,因此将这些区域定义 为兴趣区,如图1 所示:1 0 个搜索结果定义为兴趣 阿I兴趣区示仍 F i g 1 A ne x a m p l eo fa r e a s 区1 1 0 ( 绿色区域) ,顶部广告定义为兴趣区l l ( 蓝色区域) 再次,利用横、纵坐标将各注视点映 射到1 1 个兴趣区中,剔除不属于任何兴趣区的注 视点最后,按
    展开阅读全文
    提示  文档分享网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基于眼动数据的网络搜索行为预测方法.pdf
    链接地址:https://www.wdfxw.net/doc71552722.htm
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    版权所有:www.WDFXW.net 

    鲁ICP备09066343号-25 

    联系QQ: 200681278 或 335718200

    收起
    展开