您好, 访客   登录/注册

用户信息搜索策略转换模式研究

来源:用户上传      作者:袁红

  摘 要:[目的/意义]搜索策略是搜索行为的规划,是搜索过程的核心,一直是搜索行为研究的重要课题。探索用户搜索策略的运用及其转换的规律,对于IR系统的功能优化及提升用户信息搜索效率具有重要意义。[方法/过程]研究确定了来自4个搜索主题的8个搜索任务,招募了30名参与者,开展了搜索实验,并对搜索行为视频加以编码,在统计不同搜索策略使用频次的基础上,构建了常见的用户搜索策略转换模式。[结果/结论]访问和评估策略是信息搜索的常见策略,而修改查询语句、学习等搜索策略运用较少。向前访问→评估单个项目、评估搜索结果→向前访问为用户信息搜索最常见的策略转换模式,而向前访问→探索等策略转换发生概率极低。此外,用户在搜索的不同阶段的策略运用及策略转换呈现较大差异,这为IR系统设计提供了详尽有用的指导。
  关键词:信息搜索;搜索策略;策略转换
  DOI:10.3969/j.issn.1008-0821.2020.02.006
  〔中图分类号〕G254.9;G252.0 〔文献标识码〕A 〔文章编号〕1008-0821(2020)02-0044-08
  On the Transformation model of Users Information Search Strategies
  Yuan Hong
  (School of Economics and Management,Nantong University,Nantong 226019,China)
  Abstract:[Purpose/Significance]Search strategy is the planning of search behavior,the core of search process,and it has always been an important topic in search behavior research.Exploring the application of user search strategy and its transformation rules has important guiding significance for the function optimization of IR system and the improvement of user information search efficiency.[Method/Process]8 search tasks from 4 search topics were identified,30 participants were enrolled,and search experiments were carried out to encode users search behavior videos.Common transformation models of search strategies were constructed on basis of the statistics of the frequency of different search strategies.[Result/Conclusion]Access and Evaluation are the common search strategies,while Modify Query,Learning are seldom used.Access Forward→Evaluation Individual Project,Evaluation Results→Access Forward are the most common strategy transformation models,while the probability of strategy transformation models such as Access Forward→Exploration are very low.In addition,the users strategy application and strategy transformation in different design search stages would also show great differences,which provided detailed and useful guidance for the IR system.
  Key words:information search;search strategies;strategy transformation
  由于網络信息动态高速发展,网络环境的日益复杂,用户通过信息搜索获取所需信息难度也在日益加大[5]。对此,学者正努力探索用户网络信息搜索行为的特征和规律,希望设计出更好的搜索工具和更有效的信息组织方式,以应对信息爆炸以及随之而来的用户日益复杂的信息需求。搜索策略是搜索行为的规划,是搜索过程的核心,一直是信息搜索行为研究的重要课题。要深入了解信息搜索的动态过程,仅仅是识别搜索策略是不够的。搜索策略的运用及转换揭示了用户为实现其信息需求的连续的决策过程,是用户行为画像的核心要素。
  在信息搜索过程中,用户选择多种搜索策略,如创建查询,点击超链接,并评估具体信息内容的相关性等,多重策略的转换链条构成了信息搜索过程的本质。在搜索策略分析中,策略之间的过渡可以作为一个分析单元或是策略本身[1]。目前国内学者只对搜索策略进行了概念性的描述,并以查全和查准为目标探讨了如何制定科学的信息搜索策略,且大多聚焦于单一搜索策略,较少研究关注了不同搜索策略间的转换[2-3]。因此,搜索策略及其转换模式研究具有重要的理论意义,同时,它还对信息检索系统的功能优化和用户信息搜索效率的提高也具有重要的指导意义。   本文将在模拟实验情境下开展用户信息搜索过程中的搜索策略运用及转换模式的研究,主要解决如下研究问题:第一,网络搜索过程中最频繁和最不常用的搜索策略。第二,网络搜索过程常见的策略转换模式。第三,网络搜索过程中不同阶段的策略转换模式。
  1 相关研究
  1.1 搜索策略层次和类型研究
  Bates M J[4]定义了搜索策略的4个层次:1)策略表示在信息搜索中可识别的思想或行动;2)策略包括一个动作或应用推进搜索过程;3)策略是由一个或多个动作,利用特定的信息域和关联模式的搜索;4)策略代表一个计划,包括动作、选择或战术的搜索过程。Marchionini G[5]将搜索策略定义为动作、方法和策略。他认为,动作是最低层次的个人行动,策略是运用一组动作寻求信息以解决问题的方法。Xie I等[6]以整合计划模型和情境行动理论为基础,提出搜索策略是计划和情境的产物。
  对于搜索策略的类型划分,Bates M J[7]命名了29个搜索策略,并将它们分为4种类型:监控策略、文件结构策略、搜索制定策略和术语策略。Xie I等[6]将搜索策略分为13类,每一类都代表用户的一项操作或使用。
  1.2 基于特定策略的信息搜索行为研究
  Bates M J[8]提出了信息搜索的4种重要模式,即搜索(Searching)、浏览(Browsing)、追踪(Monitoring)和偶遇(Encountering)。长期以来,学者们倾向于研究基于主动信息搜索策略的信息搜索行为。随着信息搜索行为研究的深入,近年来,基于间接信息搜索策略的浏览和偶遇行为也开始受到越来越多的关注。王庆稳[9]以寻路理论为基础,采用观察、半结构化访谈、绘制地图等方法,记录用户浏览网站行为,深入分析用户使用信息浏览策略时的认知过程;俞碧飏[10]使用关键事件和扎根理论的研究方法对科研人员信息偶遇行为进行质性分析,提出个人、情境和信息是促进偶遇发生的主要因素。笔者的前期也通过搜索实验开展,探讨了浏览策略的识别,对数字图书馆信息偶遇现象的规律也进行了探讨。
  由于信息搜索策略的多元化,不同搜索策略的效率比較成为用户和学者共同面对的研究问题。Nachmias R等[11]比较了传统网络环境下搜索引擎策略、浏览策略和直接接触策略,研究发现,搜索引擎策略的效率最低,而最有效的是浏览策略。Croft W B等[12]认为社会网络和专家系统的运用、社会化数据挖掘和群体智慧均能有效提高搜寻效率,因此社会化搜索相较于传统网络搜索更具效率。Kim H N等[13]证实社会化标签搜寻在提升检索准确度和全面性上具有优越性。
  1.3 用户搜索策略的转换行为研究
  策略具有“移动”的特性,即用户会在一个搜索进程的不同阶段面对动态的信息需求和信息环境而转换其搜索策略。Bates M J[4]认为,策略转换是一系列的策略(包括部分重叠的策略)构成的更加简易化的搜索模式,以便研究者解决搜索问题;Zhang M等[14]将策略转换概括为设计和重设计搜索模式的过程;Wilson T D[15]认为策略转换是有目的的查找信息来满足用户需求而进行不断改变中间行为以达到用户满意结果的过程。
  由以上分析可知,尽管现有研究对搜索策略的理论探讨已经较为充分,对不同搜索策略的理论和实证研究也取得了较多的成果,同时对搜索策略的转换行为也有清楚的认识,但是,深入探讨策略转换规律的成果还不多见。就研究方法而言,搜索实验法被广泛运用,研究者通过平台选择、任务设计、对象选择、实施搜索、数据分析等步骤开展了各自研究领域丰富主题的研究工作。日志分析、有声思维、问卷调查、访谈等多种定量研究方法也较为常见,代表了本领域定量化实证研究的主流趋势。
  2 研究设计
  本研究采用搜索实验的方法。实验者将被要求完成事先设定的搜索任务,实验者搜索行为数据通过录屏软件加以记录。真实的全过程搜索行为数据的采集将有助于深入分析搜索行为背后隐藏的规律。
  2.1 搜索任务及阶段划分
  用户日常信息搜索主要围绕4类搜索主题:社会问题、文化娱乐、体育运动、科技教育。本研究围绕以上主题设定了8个搜索任务,具体见表1:
  实验者将被要求选择两类主题,并各完成一个搜索任务。设置一定数量的搜索任务集,而由实验者自行确定2个搜索任务的目的是提供实验者一定的选择空间,更好地模拟用户的日常信息搜索行为。
  为了充分呈现实验者在搜索过程中不同搜索策略的运用,权衡实验者的接受程度和实验要求,本研究将搜索实验时间设定为30分钟。为了便于分析随着搜索进程的推移搜索策略的动态变化,体现不同阶段搜索策略的使用频次和策略转换的时序性,搜索过程被划分为搜索前期、搜索中期和搜索后期3个阶段,每个阶段10分钟。
  2.2 实验对象
  由于搜索实验的开展具有较大难度,实验者数量很难达到问卷调查的“大样本”要求。如Xie I等[6]在研究用户信息搜索策略转换时邀请31位参与者完成搜索实验,参与者必须18岁以上和具备一定的搜索能力与经验。其他以搜索实验为主要研究方法的现有成果中,实验者数量大多为十几至几十人。因此,考虑科学性和可操作性,本研究计划从所在大学招募师生30名参与实验。
  2.3 数据采集工具
  Morae软件由Recorder、Observer、Manager三大组件组成,Recorder是用于记录用户操作行为的录屏组件,需要安装在用户操作的电脑上;Observer是供观察者使用的组件,安装在观察者电脑上;而Manager是用于后期数据分析的组件[16]。三大组件的使用关系是:Recorder和Observer建立网络连接后,Recorder负责记录用户操作,包括打开的网页、输入的检索词以及光标移动等,Observer同步展示用户操作并可以随时做标记,标明搜索阶段和用户使用的策略。最后Recorder的录屏和Observer的标记合并保存,并通过Manager进行数据分析,快速生成图表,形成研究报告。   2.4 實验流程
  实验分为准备、实施、数据提交3个阶段。
  实验准备阶段:通过QQ、人人网等平台发布实验者招募信息,实际招募30名,分别编号为1到30。在开始搜索任务之前,30位实验者需要填写背景资料的问卷,实验者阅读和明确搜索任务,实验人员介绍实验注意事项。
  实验实施阶段:参与者根据自身情况完成两项搜索任务,自由选择网络查询系统和搜索策略来寻找相关资料,然后比较查询到的相关资料,选择实验参与者认为与搜索任务最相关的资料并保存下来,创建一个名为Morae的文件夹保存在指定文件夹。
  实验数据提交阶段:收集并保存30位实验参与者的问卷及视频。
  3 数据采集与数据编码
  3.1 实验样本统计
  搜索实验共回收有效视频30份。实验参与者的人口统计学特征见表2。实验参与者男女性别比例1∶2,大多为21~40岁之间的年轻人群,学历分布均衡,能较为熟练地操作计算机。
  此外,30位实验参与者专业分布广泛,来自通信工程、信息管理与信息系统、电气工程、英语、纺织服装等6个专业。
  3.2 数据编码
  为了识别实验者使用的搜索策略,本研究在Xie I等[6]提出的基于互动意图的搜索策略的研究成果的基础上,确定了如表3所示的10种搜索策略,并进行了编码。
  3.3 实验数据
  通过视频数据分析,共识别出30位参与者执行60项搜索任务时的1 310项搜索策略。以实验者13的实验数据为例,该实验者选择的搜索任务为“最低工资标准”和“伦敦奥运会奖牌”,创建查询语句为“最低工资标准”、“里约奥运会中国奖牌数”。该实验者在搜索过程中搜索策略使用情况见表4,搜索策略转换频次见表5,不同阶段的搜索策略转换模式见表6。
  统计汇总30位实验参与者搜索策略数据,展开以下的数据分析。
  4 数据分析
  4.1 不同搜索策略应用
  4.1.1 基于整个搜索过程的用户搜索策略应用
  整个搜索过程10种搜索策略的使用频次和比例如表7所示。
  最常用的策略是向前访问(AF)。用户键入URL访问特定项目是网络信息搜索的主要策略,通过该策略不断接近搜索目标。第二个最常用的策略是评估单个项目(EI),用户信息搜索是理性决策行为,需要通过不断评估调整搜索策略,改变搜索路径。搜索过程中超过一半的策略应用都是向前访问或评估单个项目。评价搜索结果(ER)排第三,对搜索引擎返回结果相关性的判断是搜索的必经之点,发生的频次虽不及向前访问和评价单个项目,但也显示出搜索引擎返回结果的质量对于用户信息搜索的重要作用。
  使用最少的是学习策略(LR),使用频次几乎可以忽略,这表明,用户的搜索努力是通过向前访问、评价单个项目、评价搜索结果、向后访问等诸多策略的频繁使用体现出来,而学习策略极少使用,这似乎与搜索过程也是一个学习过程的普遍认识相违背,从认知角度来说,搜索也是不断改变认知的学习,但本文界定的学习策略比较狭义,是获取特定系统特征、结构、数据内容,有学习如何使用之意,如谷歌地图的学习,相较于广义的学习,发生的几率要小得多,再加之实验任务的设定,也导致了该策略的极少应用。此外,在搜索过程中,保存记录(R)和修改查询语句(M)策略分别占比1%和3%,因为查询语句只是信息需求的表达,当用户需求逐渐明确后,更多的搜索行为是围绕着信息的评价和选择,查询语句不会频繁更改;保存记录策略使用少的原因在于从海量网络信息中获取有价值信息的难度越来越大,使得保存记录策略失去发生的前提。
  4.1.2 不同阶段搜索策略的应用
  表8显示,在搜索前期排名前5的搜索策略依次为向前访问(AF)、创建查询语句(C)、评价搜索结果(ER)、识别搜索线索(L)、评价单个项目(EI);搜索中期排名前5的搜索策略依次为向前访问(AF)、评价单个项目(EI)、向后访问(AB)、探索(XPL)、评价搜索结果(ER);搜索后期排名前5的搜索策略依次为向前访问(AF)、评价单个项目(EI)、向后访问(AB)、评价搜索结果(ER)、探索(XPL)。可以认为,搜索前期的策略运用与后续阶段差异较大,搜索中后期的策略运用较为相似。在各个阶段排名前5的策略中,向前访问(AF)、评价搜索结果(ER)、评价单个项目(EI)均在列,说明评价和选择一直伴随着用户的整个搜索进程。另一方面,除了各阶段排名前5的搜索策略外,其余策略的使用频次普遍偏低,均在5%以下,说明用户的实际搜索策略呈现部分策略主导的特点。
  在搜索前期,识别搜索线索(L)、创建查询语句(C)和评价搜索结果(ER)的比例比后续阶段的都要高,用户处于需求表达、努力寻求信息线索并不断试探的状态。在搜索中期观察到的811次搜索策略中,向前访问(AF)和评价单个项目(EI)占比超过一半,且探索(XPL)策略的比例高于其它阶段。可以认为,向前访问和评价单个项目是用户在搜索中期的主要策略,且搜索中期的行为具有明显的探索性,通过搜索和学习,用户对搜索路径和搜索目标逐渐明晰。在搜索后期,评价单个项目(EI)比前两阶段的使用比例都高,且随着搜索的进行越来越多地评估具体的信息内容,相应地,评价搜索结果(ER)随着搜索的进行使用比例逐渐下降,意味着越接近搜索目标,用户的评估行为越聚焦于具体的信息内容,而非广泛地浏览判别搜索引擎的搜索结果。
  4.2 常见的搜索策略转换模式
  4.2.1 基于整个搜索过程的搜索策略转换
  对30位参与者执行60个搜索任务的1 310个搜索策略编码统计,形成搜索策略转换矩阵(略),该矩阵每个单元格的值表示从行策略到列策略的转换频次。在10*10转换矩阵所表示的100对策略转换中,75对之间存在转换。最频繁的转换是AF→EI,共有142次。从AF到EI的切换表明,用户访问了某个项目,然后评估了它的相关性,该搜索策略组合不断推动着搜索向前发展。排在第二的转换模式是ER→AF,共发生122次,用户迅速评估搜索结果,继而访问有价值的信息项目。接下来的常见策略转换模式依次是“XPL→AF”(114次),“EI→AB”(96次)和“AB→ER”(91次),这几组转换模式充分体现了搜索过程的探索性和循环反复性。   另一方面,用戶搜索过程中存在大量的零转换和低频转换,如创建查询语句→向后访问的搜索行为没有观察到;不常发生策略转换也有很多,频次也都只有1~2次,如创建查询语句→识别搜索线索,向前访问→探索等,表明在用户的信息搜索行为的不确定性表面下仍然隐藏着确定的规律性。
  4.2.2 基于不同阶段的搜索策略转换
  选择表7中最常使用的7种策略(向前访问AF、评价单个项目EI、评价搜索结果ER、向后访问AB、探索XPL、创建查询语句C、识别搜索线索L)分阶段统计使用顺序和频次,结果见表9。
  从表9可知,在搜索的3个不同阶段分别形成了如图1所示常见策略转换模式。
  5 结论及启示
  研究结论从3个方面为IR系统设计提供了指导:1)如何有效地支持不同类型的应用策略;2)如何有效地支持最频繁的策略转换;3)如何有效地支持信息搜索不同阶段的策略转换。
  5.1 用户搜索策略使用偏好
  为了有效地支持不同类型搜索策略的运用,研究人员需要了解用户的搜索策略使用偏好。向前访问(AF)和评价单个项目(EI)的应用超过50%。通过几次点击或输入URL可以向前访问,评估单个项目需要用户较多的认知消耗以判断项目的相关性、实用性和可信度。系统设计必须强调有助于用户判断项目质量的信息,此外,呈现和突出显示文档的原信息、提示最佳段落或生成摘要、直接提供具体信息相关的答案而不仅仅是在全文中高亮查询关键词都是行之有效的设计思路。
  评估搜索结果(ER)是排名第三的使用策略。系统可以通过为Web文档提供简明扼要的摘要和信息替代,为用户评估搜索结果提供更好的支持。可以对搜索结果列表进行有更多的信息组织,如分类和概述。Kules B等[17]通过实验研究了用户对Web搜索结果分类概述的使用,结果表明,分类概述不仅有助于用户对结果的有效评估,而且能促使用户能够改变和采用新的搜索策略。
  学习和探索是最少应用的搜索策略。用户在搜索信息时通常不愿付出更多的努力重新组织信息或重新构建查询,学习和探索难以展开。这与缺乏系统功能支持或帮助功能设计不佳有关。搜索历史记录和搜索路径可以是用户快速到达目标的有用工具[14]。因此,帮助页面应该被集成到实际的浏览和搜索页面中,应创建搜索历史和搜索路径选项,以辅助用户的学习与探索。
  5.2 用户搜索策略转换模式
  如何促进基本转换和如何减少不必要的转换是明确了用户常见搜索策略转换模式后需要思考的问题。基本转换是指搜索过程中关键的转换,不能被忽略,而不必要的转换是指可跳过或合并的转换。每种类型的搜索策略都有自己最常见的策略转换。对于IR系统来说,重要的是要帮助用户更有效和便捷地实现转换。而这些最常发生的转换模式有助于帮助IR系统预测接下来用户最可能使用的搜索策略,并提供支持该策略的功能选项。例如,向前访问(AF)→评估单个项目(EI)是最常见的转换模式之一。当用户单击链接或键入URL时,IR系统检测到向前访问策略,这时,系统就可以提供前面讨论过的评估单个项目的支持功能,以帮助用户快速准确地使用资源。
  在搜索过程中搜索策略的应用并不总是“越多越好”。通过改进IR系统的设计,使用户实际操作时实现某些合并策略的功能,减少不必要的搜索策略的使用。例如,在评估单个项目(EI)后,如用户对此项目不满意,往往会向后访问(AB)搜索结果并识别下一个将要访问的项目。IR系统可以设计为将搜索结果保留在与所选项目相同的页面上进行评估,大大减少不必要的搜索步骤。此外,用户在搜索时如遇到一些访问问题,如死链接,系统错误等也会采用向后访问(AB),此时IR系统如果能指导用户进入更新的站点或相关站点将有助于搜索进程的推进。
  5.3 不同任务阶段的用户搜索策略模式
  由于不同阶段应用了不同的搜索策略,所以IR系统能够根据排名靠前的策略转换模式预测后续策略。因此,IR系统可以设计有不同的模板,对处于不同搜索阶段的用户提供支持,以引导用户搜索行为。在搜索前期,IR系统可以为用户提供两种类型的选项:便于用户通过检索词来搜索,或帮助用户根据最初识别的信息来探索。在搜索中期,对于喜欢通过输入查询进行搜索的用户,系统设计应该通过减少不必要的过渡来整合评估过程;对于喜欢探索的用户,IR系统的设计需要创建一个并行页面,可以探索更高或更低级别的页面。在搜索后期,IR系统可以整合用户的个人空间,以便用户可以多途径的利用信息,如将搜索结果引用到论文中或者通过电子邮件发送给同事等。
  6 结 语
  本研究不仅确定了最频繁和最不常用的搜索策略,而且分析了这些策略在不同阶段的应用。频繁策略的识别确立了用户网络搜索的关键行为,IR系统的优化必须促进这些必要的转换,同时也要化繁为简,减少不必要的转换,以减少用户的搜索成本。本研究最重要的贡献是通过分析搜索策略的顺序转换,总结了用户在网络搜索过程中最常见的行为模式,为建立真正以用户为中心的IR系统提供了切实的设计原则,以提升用户搜索体验。后续研究将结合用户个体特征研究其搜索策略转换模式,以期为基于用户分群的IR系统的个性化功能设计提供深入的指导。
  参考文献
  [1]Xie H I.Shifts of Interactive Intentions and Information-seeking Strategies in Interactive Information Retrieval[J].Journal of the Association for Information Science and Technology,2000,51(9):841-857.
  [2]马海群,杨志和.身心语言程式视阈下的信息检索用户认知模型研究[J].中国图书馆学报,2011,37(3):38-47.   [3]代君,郭世新.协同信息搜索行为的触发情景因素探析——基于高校学生个人信息搜索失败情景[J].图书情报知识,2016,(5):62-72.
  [4]Bates M J.Where Should the Person Stop and the Information Search Interface Start?[J].Information Processing & Management,1990,26(5):575-591.
  [5]Marchionini G.Information Seeking in Electronic Environments[M].Information Seeking in Electronic Environments,1995.
  [6]Xie I,Joo S.Transitions in Search Tactics During the Web-based Search Process[J].Journal of the Association for Information Science and Technology,2010,61(11):2188-2205.
  [7]Bates M J.Information Search Tactics[J].Journal of the Association for Information Science and Technology,1979,30(4):205-214.
  [8]Bates M J.Toward an Integrated Model of Information Seeking and Searching[J].The New Review of Information Behaviour Research,2002,(3):1-15.
  [9]王庆稳.基于寻路理论的网络用户信息浏览行为研究[D].重庆:西南大学,2009.
  [10]俞碧飏.信息偶遇概念与特点的实证辨析:以科研人员为例[J].情报学报,2012,31(7):759-769.
  [11]Nachmias R,Gilad A.Needle in a Hyper Stack:Searching for Information on the World Wide Web[J].Journal of Research Technology in Education,2002,34(4):475-486.
  [12]Croft W B,Lafferty J.Language Modeling for Information Retrieval[M].Springer Publishing Company,Incorporated,2010.
  [13]Kim H N,Rawashdeh M,Saddik A E.Leveraging Collaborative Filtering to Tag-Based Personalized Search[C]//International Conference on User Modeling,Adaption,and Personalization.Springer-Verlag,2011:195-206.
  [14]Zhang M,Jansen B J,Spink A.Information Searching Tactics of Web Searchers[J].Proceedings of the American Society for Information Science & Technology,2006,43(1):1-14.
  [15]Wilson T D.Human Information Behavior[J].In-forming Science,2000,3(2):49-56
  [16]Morae官網[EB/OL].http://www.techsmith.com/morae.html,2017-08-30.
  [17]Kules B,Shneiderman B.Users Can Change Their Web Search Tactics:Design Guidelines for Categorized Overviews[J].Information Processing and Management,2008,44(2):463-484.
  (责任编辑:郭沫含)
转载注明来源:https://www.xzbu.com/4/view-15295356.htm