您好, 访客   登录/注册

电子商务平台中卖方诚信博弈模型研究

来源:用户上传      作者:

  摘 要:卖方为追求利润快速增长会通过各种攻击策略破坏电子商务平台信誉系统。现有抵御策略大多是通过机器学习等相关技术从过程或结果治理角度实现,但这些方法很难从根本上解决虚假交易问题。针对以上问题,结合博弈论机制设计领域相关知识,从减少造假动机角度出发,提出一种适应于无垄断型电商市场对称演化的卖方诚信博弈模型。模型稳定性理论分析和模拟仿真实验都直观清晰地展示出模型中各参数对电商市场中卖家诚信演化稳定性的影响。实验结果表明,从动机角度出发,采取相应措施能够又好又快地促进更多的卖方选择诚实交易策略。随着演化的进行,虚假交易将最终退出市场。
  关键词:电子商务;造假动机;机制设计;演化博弈;无垄断
  DOI:10. 11907/rjdk. 191467
  中图分类号:TP301   文献标识码:A                 文章编号:1672-7800(2020)003-0021-06
  Research on Sellers’ Honest Game Model on E-commerce Platform
  JI Shu-juan1,2,BAO Chun-xiao1,SUN Guan-guan1,ZHANG Chun-jin3
  (1. College of Computer Science and Engineering, Shandong University of Science and Technology;
  2. Key Laboratory for Wisdom Mine Information Technology of Shandong Province, Shandong University of Science and Technology;
  3. Network Information Center, Shandong University of Science and Technology, Qingdao 266590,China)
  Abstract:In order to pursue rapid profit growth, many sellers damage the reputation system of e-commerce platform through various attack strategies. Most of the existing defense strategies are implemented from the perspective of process or result governance through machine learning and other related technologies, but these methods are difficult to fundamentally avoid the occurrence of false transaction phenomenon. In view of the above problems, by combining with the relevant knowledge in the field of game theory mechanism design, this paper puts forward a seller’s honesty game model adapted to the symmetrical evolution of non-monopoly e-commerce market from the perspective of reducing the motivation of fraud. Both the theoretical analysis of the model stability and the simulation experiment clearly and intuitively demonstrate the influence of the parameters in the model on the integrity evolution stability of sellers in the e-commerce market. The experimental results show that, from the perspective of motivation, taking appropriate measures can promote more sellers to choose honest trading strategies quickly and well. As the evolution progresses, there will be no more false transactions in the market eventually.
  Key Words:E-commerce; fraud motivation; mechanism design; evolutionary game; no monopoly
  0 引言
  電子商务平台在繁荣景象的背后已经出现了非常严重的信任问题。相比现实生活中的面对面交易,网络交易具有匿名性、虚无性和不对称性等特点,致使在电子商务平台中建立信任比较困难。
  现有的信用评价模型能够防御大多数攻击策略,但不能抵御所有信用攻击。在造假评价比重占比较多的情况下,基于累加方法的信用模型(AARE模型[1]、E-Sporas模型[2]和C2CRep模型[3])对女巫的抗攻击性较差;基于过滤方法的信用模型(iCLUB模型[4-5]和BRS模型[6])和基于信念的信用模型(LTSL模型[7-8]和TNA-SL模型[9])能够抵御大多数信用攻击策略,但对女巫攻击和漂白攻击抵御能力较差;基于折扣方法的信用模型(TRAVOS模型[10]和Personalized模型[11])对女巫攻击和共谋攻击的抗击能力较差;基于贝叶斯概率的信用模型(FG-Trust模型[12])虽然对抵御女巫攻击和共谋攻击效果较理想,但对漂白攻击的抗击能力较差;基于进化方法的信用模型(MET模型[13]和PEALGA模型[14])又对不公平评分的抗攻击能力较差。   虚假交易虽然是造假者给出的,但是真正的根源是卖方的造假需求,所谓没有需求就没有杀戮,进而产生水军黑色产业链,真正的造假者是卖方。现在比较流行的防御策略都是基于机器学习的方法,从过程或结果角度出发减少虚假交易,这些方法很难从根本上解决虚假交易问题。本文从减少造假动机角度出发,提出卖方的诚信博弈模型。
  1 相关工作
  马喆等[15]研究指出,我国现阶段的信用危机主要表现为企业和政府的信用缺失,因而应建立与我国经济结构相适应的信用奖惩机制。
  龙游宇[16]从博弈论角度解释经济学关系,指出传统博弈论强调所有参与实体采取理性的决策行为,选择对自己最有利的决策策略,最终找到最优解。
  然而,生活中买卖双方的行为虽然具有理性,但属有限理性或不完全理性。为解决这一问题,Maynard等[17]从生物学角度出发,在经济学博弈论的研究思路中引入生物进化论,首次提出演化稳定策略概念(Evolutionary Stable Strategy,ESS),将传统博弈分析和动态演化分析紧密结合,更加直观地描述系统的整个演化发展过程。
  Cai等[18]创新性地从动机角度出发研究了基于机制设计的个性化推荐模型。受以上研究启发,本文结合演化博弈机制设计理论领域相关知识,从参与造假动机的角度出发,结合适当的奖惩措施,提出一种对称演化的卖方博弈模型。
  2 模型基本框架
  2.1 基本假设
  综合考虑生活中无垄断型电子商务交易市场情况,结合本文研究重点作出以下假设:①电子商务交易市场中参与博弈的双方是具有竞争关系的卖方;②电子商务交易市场中参与博弈的卖家所经营的商品价格都一样;③无垄断型电子商务交易市场中參与博弈的所有卖家之间地位均等,造假风险相等,他们选择诚实策略和不诚实策略的概率也相等;④电子商务交易市场中诚实卖家占比与单个卖家选择诚实策略的概率相等,设为[p]。
  2.2 模型框架
  基于前述假设,给出模型基本框架如图1所示。
  由图1可知,博弈角色包含诚实卖方和不诚实卖方,他们的策略行为选择是根据收益进行的。对于卖方来说,当采取造假策略交易所获的收益小于或等于采用诚实策略交易所获收益时,就会选择诚实策略,相反则会选择不诚实策略。不诚实的卖方Agent通过与不诚实的买方Agent共谋合作,进行虚假交易和恶性竞争。
  模型收益矩阵如表1所示,表1无垄断型电子商务交易市场对称演化博弈模型收益矩阵中各个参数的意义如表2所示。矩阵中博弈双方都是卖方Agent,由假设④可知他们选择策略行为1(Honest)的概率为[p],选择不诚实策略行为2(Dishonest)的概率就为[1-p]。
  2.3 模型稳定性
  定义1:卖方的总体期望收益为[19]:
  其中,[Ψ1]表示卖方选择诚实策略时的期望收益,[Ψ2]表示卖方选择不诚实策略时的期望收益,则:
  定义2:卖方的复制者动态方程(RD)[19]为:
  根据演化稳定策略(以下简称ESS)所满足的条件[20],令复制者动态方程等于零,得方程的解为:[p1=0],[p2=1],[p3=B-e+fB-kf+f]。得到的3个解是否是稳定解,需要用ESS判断是否达到稳定状态条件[20]。本文分别讨论以下3种情况:
  (1)[p3<0],即[0<B<e-f],表示卖家采用不诚实交易策略受到惩罚后的收益比采用诚实交易策略时获得的收益大,即惩罚力度较小,由[F(p1=0)<0],[F(p2=1)>0],得[p=p1],这是垄断卖方的演化稳定点,惩罚力度较小时的动态演化相位图如图2(a)所示。
  (2)[0p31],即[Be-f]且[e-kf0],表示卖家采用不诚实交易策略比采用诚实交易策略获得的收益小,即惩罚力度适中,同理可得[p=p3],这是垄断卖方的演化稳定点,动态演化相位图如图2(b)所示。
  (3)[p3>1],即[e-kf<0],表示采用不诚实交易策略受到惩罚后的收益不但比诚实交易获得收益小,而且还会损失一部分自身成本,即惩罚较大。同理可得,[p=p2]是垄断卖方的演化稳定点,动态演化相位图如图2(c)所示。
  以上通过理论分析验证了相关部门惩罚虚假交易不同力度下博弈的演化稳定点。下面从多Agent演化博弈实验展示博弈的演化过程。
  3 实验验证
  由现实生活可知,[A]和[e]与市场的机制设计无关,所以本文在进行仿真实验时对这两个因素进行相应赋值。
  无垄断型电商市场的卖方博弈模型演化算法如表3中算法1所示。模拟现实中的无垄断卖家电子商务市场交易情景,分别对[B]、[e]、[k]、[f]和[p0]等参数有效赋值,那么市场中的卖家Agent会根据收益矩阵权衡造假交易的收益与真实交易收益之间的大小,然后做出策略选择。
  3.1 卖方诚信/造假博弈模型演化算法
  无垄断型电子商务交易市场的对称演化博弈模型演化算法如下:
  输入:
  [B]:有关部门对采用诚实策略卖家的奖励
  [e]:采取不诚实策略卖家获得的不正当收益
  [k]:采用不诚实策略卖家被有关部门检测到的概率
  [f]:采用不诚实策略卖家被有关部门检测到后所受到的惩罚
  [p0]:市场中采用诚实策略的卖方初始占比
  输出:
  [pti]:演化过程中[ti]时刻诚实卖方的市场占比。其中[i∈N+],表示演化博弈所经历的演化次数
  过程:
  for(i=1;[pti+1≠pti];i++){//,当演化后的诚实卖家Agent市场占比与演化前不相同时迭代循环继续,直到相同时结束迭代循环   //市场中的所有博弈卖家Agent之间进行策略收益比较,然后重新选择新的策略
  if(造假交易收益≤真实交易收益) Dishonest buyer Agent→Honest buyer Agent;//不诚实卖方会转变为诚实卖方
  if(造假交易收益>真实交易收益) Honest buyer Agent→Dishonest buyer Agent;//诚实卖方会转变为不诚实卖方
  }
  3.2 惩罚对市场信用演化稳定性的影响
  為了验证惩罚对卖家信用演化稳定性影响,首先控制其它变量不变,令[Δt=0.1],[B=2],[e=5],[k=0.6],使惩罚[f]逐渐增大。设置10组电子商务交易市场中诚实卖家占比[p0]的初始状态,分别为0.95、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1、0.05。然后分别模拟不诚实卖家Agent造假后所受的惩罚[f]从0不断增大时该模型信用演化稳定情况。
  图3分别为惩罚力度相对较小时,电子商务交易市场中卖家Agent的博弈信用演化曲线。经过一段时间的博弈演化后,演化博弈曲线最终会稳定在稳定点[p1=0],即电子商务交易市场中的卖家Agent最终都会选择不诚实策略,此时市场中充斥着虚假交易。纵向比较图3可以发现,当惩罚力度逐渐增大时,博弈演化趋于稳定的时间越来越长。
  结论1:当惩罚力度相对较小时,惩罚力度逐渐增大会抑制博弈演化的速度,对那些采取不诚实策略的卖家Agent有一定的抑制作用。
  图4分别为惩罚力度相对适中时电子商务交易市场中卖家Agent的博弈信用演化曲线。经过一段时间的博弈演化后,电子商务交易市场中诚实卖家Agent占比最终会稳定在点[p3]。同样纵向比较图4,可发现当惩罚力度相对适中时,随着惩罚力度的逐渐增大,博弈演化趋向于稳定的时间基本一致,但是博弈演化稳定点在逐渐增大。
  结论2:惩罚力度相对适中时,博弈演化稳定后电子商务交易市场中的诚实卖家Agent占比会随着惩罚力度逐渐增大而增大,博弈的演化稳定速度基本不会受到影响。
  图5分别为惩罚力度相对较大时电子商务交易市场中卖家Agent的信用演化博弈曲线。在经过一段时间的博弈演化后,演化博弈曲线最终会稳定在稳定点[p2=1],即电子商务交易市场中的卖家Agent最终都会选择诚实策略。纵向比较图5可以发现,当惩罚力度逐渐增大时,博弈演化趋向于稳定的时间越来越短。
  结论3:当惩罚力度相对较大时,惩罚力度逐渐增大会加快博弈演化速度,使那些采取不诚实策略的卖家Agent加速转变为采取诚实策略。
  图6分别为惩罚值非常大时电子商务交易市场中卖家Agent的博弈信用演化曲线,此时博弈的演化速度非常快。经过一段时间的博弈演化,当惩罚超过24时,博弈演化后市场中的诚实卖方占比会超过1,这明显与常理不符。
  结论4:在电子商务交易市场中,有关部门对采用不诚实策略卖家Agent的惩罚力度不能够无限制增大。如果惩罚力度无限加大,会破坏市场稳定性,市场就会出现萎缩。在现有设置下,当惩罚值[f=24]时,惩罚效果最好,此时市场会以最快的速度达到所有卖家都诚信的状态。
  3.3 奖励对市场信用演化稳定性的影响
  对采取诚实策略的卖方进行奖励后验证其对模型演化稳定性的影响。首先控制其它变量不变,使奖励逐渐增大。为便于观察变化,本组实验选取惩罚适中时的演化稳定点[p3]进行观察。设置[f=5],对[e]和[k]等参数采用与前文同样的赋值,设置10组[p0]的初始状态。采取诚实策略卖家奖励值[B]对模型演化稳定点的影响如图7所示。
  图7分别为不同奖励值对应的卖家Agent博弈信用演化曲线。首先,横向比较图7可发现,随着奖励的增大,市场中卖家Agent会越来越多地选择诚实策略;其次,纵向比较图7发现,随着奖励越来越大,市场中的卖家Agent会越来越快地选择诚实策略。
  结论5:有关部门对电商交易市场中选择诚实策略的卖家奖励越大,越能够促进市场卖家更多更快速地选择诚实交易策略。当然,现实生活中不存在奖励无限制增大的情况,因此在适度的奖励范围内给出最大的奖励,能够更快更好地促进市场诚实化发展。
  3.4 造假交易准确率对市场信用演化稳定性影响
  为了验证市场有关部门加大检测力度对卖方Agent的信用演化稳定性影响,本文同样对[B]、[e]、[k]、[f]和[p0]等参数有效赋值。首先控制其它变量不变,使检测力度逐渐增大,即当电子商务交易市场中卖方Agent采取不诚实策略被有关部门检测到的概率[e]逐渐增大时,验证对卖方Agent信用稳定性的影响。令[Δt=0.1],[B=2],[e=5],[k]为变量,同时取[f=5],市场有关部门加大检测力度对博弈演化稳定点的影响如图8所示。横向比较图8中各图,随着[k]值逐渐增大,市场信用演化稳定点逐渐提高。当[k]值为1时,经过一段时间的信用演化,市场中诚实卖家占比会稳定到1。
  结论6:提高检测虚假交易的准确率,能够促进电商市场中卖家选择诚实策略。当检测虚假交易的准确率为1时,所有的造假交易均能检测到,此时经过一段时间的信用演化后,市场中所有卖家均会选择诚实交易策略。
  结论7:从动机角度出发,电商交易市场有关部门加大检测力度,提升检测造假概率并采取适当的惩罚和奖励措施,能够又快又好地促进更多卖方选择诚实交易策略。随着演化进行,最终市场将不会有虚假交易。
  从实验结果得出结论:从动机角度出发,电商交易市场有关部门加大检测力度,提升造假检测概率,并采取适当的惩罚和奖励措施,能够又快又好地促进更多卖方选择诚实交易策略。随着演化进行,最终虚假交易会退出市场。
  4 结语   本文研究了现阶段电子商务市场的虚假交易状况和演化博弈理论,从全新的动机角度出发,结合演化博弈理论思想,提出适应于无垄断型电商市场对称演化的卖方诚信/造假博弈模型。首先,对模型稳定性进行了理论分析,然后通过模拟仿真实验直观展示模型中各参数(奖励、惩罚等)对电商市场中卖家信用演化稳定性的影响。
  本文不仅提出了对称演化的卖方诚信/造假博弈模型,为演化博弈理论应用于电商市场诚信/造假提供理论基础,而且从动机角度出发,验证了制定适当的机制能够使市场虚假交易在一定时间后降低乃至消失的情况。未来要进一步深入市场调研,了解全面多样性的市场交易情况,从整体上全面分析电商平台交易信息,制定更加准确的模型,做到不仅从整体上演绎市场变化过程,还能具体到某一时刻市场的演化状态。
  参考文献:
  [1]JI S, LIU B, ZOU B, et al. An anti-attack model for centralized C2C reputation evaluation agent[C]. IEEE International Conference on Agents. IEEE, 2017:63-69.
  [2]GIORGOS ZACHARIA, PATTIE MAES. Trust management through reputation mechanisms[J].  Applied Artificial Intelligence, 2000, 14(9):881-907.
  [3]熊建英, 鐘元生.  一种抗欺诈的C2C卖方信誉计算模型研究[J].  计算机科学, 2012, 39(2):68-71.
  [4]LIU S,ZHANG J,MIAO C, et al. iCLUB: an integrated clustering-based approach to improve the robustness of reputation systems[C]. The International Conference on Autonomous Agents and Multiagent Systems. International Foundation for Autonomous Agents and Multiagent Systems, 2011:1151-1152.
  [5]LIU S, ZHANG J, MIAO C, et al. An integrated clustering-based approach to filtering unfair multi-nominal testimonies[J].  Computational Intelligence, 2014, 30(2):316–341.
  [6]WHITBY A, JOSANG A, INDULSKA J. Filtering out unfair ratings in Bayesian reputation systems[C]. International Joint Conference on Autonomous Agenst Systems. Autonomous Agents & Multi Agent Systems, 2004:106-117.
  [7]HAYDAR C, ROUSSANALY A, BOYER A. Local trust versus global trust networks in subjective logic[C]. IEEE/WIC/ACM International Joint Conferences on Web Intelligence. IEEE, 2013:29-36.
  [8]HAYDAR C, BOYER A, ROUSSANALY A. Comparing local, collective, and global trust models[J].  International Journal on Advances in Life Sciences, 2014, 6(1):30-40.
  [9]JOSANG A, BHUIYAN T. Optimal trust network analysis with subjective logic[C]. International Conference on Emerging Security Information, Systems and Technologies,2008:179-184.
  [10]TEACY W T L, PATEL J, JENNINGS N R, et al. Travos: trust and reputation in the context of inaccurate information sources[J].  Autonomous Agents and Multi-Agent Systems, 2006, 12(2):183-198.
  [11]ZHANG J,COHEN R. Evaluating the trustworthiness of advice about seller agents in e-marketplaces: a personalized approach[J]. Electronic Commerce Research & Applications, 2008, 7(3):330-340.
  [12]田俊峰,田瑞.  基于领域和贝叶斯网络的P2P电子商务细粒度信任模型[J]. 计算机研究与发展, 2011, 48(6):974-982.   [13]JIANG S, ZHANG J, ONG Y S. An evolutionary model for constructing robust trust networks[C]. International Joint Conference on Autonomous Agents and Multiagent Systems. 2013:813-820.
  [14]JI S J, MA H Y, ZHANG S L, et al. A pre-evolutionary advisor list generation strategy for robust defensing reputation attacks[M]. Amsterdam:Elsevier Science Publishers,2016.
  [15]马喆.  我国信用缺失问题分析——基于博弈论视角[J].  经济研究导刊,2007(12):21-23.
  [16]龙游宇. 信用的博弈演化研究[D]. 成都:西南财经大学, 2007.
  [17]SMITH J M. Evolutionary game theory[J].  Physica D Nonlinear Phenomena,1986, 22(1-3):43-49.
  [18]CAI Q,FILOS-RATSIKAS A,LIU C,et al. Mechanism design for personalized recommender systems[C]. ACM Conference on Recommender Systems. ACM, 2016:159-166.
  [19]SCHUSTER P,SIGMUND K. Replicator dynamics[J].  Journal of Theoretical Biology,1983,100(3):533-538.
  [20]张良桥. 进化稳定均衡与纳什均衡——兼谈进化博弈理论的发展[J]. 经济科学,2001,23(3):103-111.
  (责任编辑:杜能钢)
  收稿日期:2019-04-04
  基金项目:国家自然科学基金项目(71772107,71403151,61502281,61433012);青岛社会科学规划研究项目(QDSKL1801138);山东省重点研发计划项目(2018GGX101045);山东省自然科学基金项目(ZR2018BF013,ZR2013FM023,ZR2014FP011);山东省研究生质量提升计划项目(2016);山东科技大学领军人才计划项目(2014);泰山学者攀登计划项目(2014)
  作者简介:纪淑娟(1977-),女,博士,山东科技大学计算机科学与工程学院、山东省智慧矿山信息技术重点实验室副教授,博士生导师,研究方向为人工智能与智能商务信息处理;包春晓(1994-),女,山东科技大学计算机科学与工程学院硕士研究生,研究方向為人工智能与智能商务信息处理;孙冠冠(1992-),男,山东科技大学计算机科学与工程学院硕士研究生,研究方向为人工智能与智能商务信息处理;张纯金(1977-),男,硕士,山东科技大学网络信息中心工程师,研究方向为智能信息处理、网络安全。本文通讯作者:纪淑娟。
转载注明来源:https://www.xzbu.com/8/view-15217523.htm