新闻中心

阿尔法狗的人工智能,在二手车领域该如何利用?

   2016年3月15日,轰动全球的围棋“人机大战”落下帷幕。Google DeepMind的阿尔法狗甫登擂台就先声夺人连下三城,第4盘机器出bug送出一局后,第5盘恢复正常的电脑再次以优异的表现取胜,从而以四胜一负的绝 对优势横扫李世石九段。

   数据分析技术*适合用在随时“生产”无成本数据,在这一项上,二手车交易无疑是符合条件的。
   2016年3月15日,轰动全球的围棋“人机大战”落下帷幕。Google DeepMind的阿尔法狗甫登擂台就先声夺人连下三城,第4盘机器出bug送出一局后,第5盘恢复正常的电脑再次以优异的表现取胜,从而以四胜一负的绝 对优势横扫李世石九段。可以毫不夸张地说,围棋这个“人类智慧的*后堡垒”已在“人工智能”的凌厉攻势下宣告沦陷。那么,在二手车领域,人工智能又会发挥怎样的作用呢?

   策略神经元与价值神经元:计算机的“人工智能”

   笔者看来,阿尔法狗的**性突破,就是找到了“感觉”的路径:神经元网络深度学习。

   DeepMind团队为阿尔法狗配备了两个相辅相成的“大脑”:提供落子推荐(MovePicker)的策略神经元(Policy Network)与负责形势判断(PositionEvaluator)的价值神经元(Value Network)。

   策略神经元作为阿尔法狗内核跟人脑*相似的部分,就是提供上文所提“灵感”的“人工智能”。这是必须通过数以 百万计的反复“学艺”,先是跟着人类多年积累下来的一盘又一盘名局打谱,然后从低到高不断跟人类对弈,直到“入段”之后自己跟自己下棋,一点一点培养出扫 一眼棋盘就能看到哪里“可以一战”的“感觉”。

   跟人类的学习过程很类似是吧。不仅如此,此类神经元网络还有一个类似人脑的特点:不知道为什么知道。更早更 “原始”的计算机工具,比如说线性或非线性回归分析,*后都可以给出公式亮出系数,并且报告哪个系数的权重是多少。可是阿尔法狗用的这类神经元,能够学会下棋,能够学会开车,但就是无法对学习成果给出一个像样的解释----没有公式,没有系数,什么都没有,*多给出一个拟合的输入端系数权重,还要即刻声明 那只是一个估算,仅供参考。倘若阿尔法狗的策略神经元会说话,他/她会跟人类围棋高手一样说不清为什么要下在那里----就是“感觉”那个点好啊…

   这个解释对人类或许已经足够了,内核里头必须计算解决问题的电脑却不能接受,于是价值神经元出场。这玩意,用 木谷门提倡的语言形容,就是专业干“形势判断”的活。当策略神经元产生了“感觉”出来的十几几十个选择后,价值神经元就会一一研判倘若这么走了黑白双方赢 棋的概率。有了整体形势判断,就可以进一步缩小排查范围,直到确定当前这一手落子的*佳位置。

   这样的“大数据”,抑或是几个“思考网络”翻筋斗式互连互通的“深度学习”技术,笔者还是更愿意称之为自学习式的超级数据分析----早已不仅是在下棋,从无人驾驶到红绿灯控制,从消费信用评级到故障诊断排查,许多军用与民用领域都能找到这些“人工智能”的身影。

   不过,还是那句话:它们压根没有一点点智能,从来都是只会计算不会思考,然而这并不妨碍它们非凡的在许多方面已然超越人类的外在表现。

数据可获得性与二手车估价

   既是如此,许多读者想必会关心在更贴近生产生活的领域,超级数据分析,或者姑且就呼之为“大数据”,能够发挥多大的作用。譬如说,困扰业界已久的二手车价格评估,是否可以成为“人工智能”深度学习的拿手好戏?

   当然是可以的。只不过,有一个额外的条件。这里有一个阿尔法狗完全不用在乎,现实世界里却必须直面的问题:数据可获得性。

   作为数据分析工具,毫无疑问得有数据才能玩得转。阿尔法狗所需的全部数据都在那张棋盘上,无论对局双方还是联 得上服务器的棋迷,对落子的位置全都一目了然。懂得自学习的神经元网络可以尽情地分析这些数据,不存在拿不到数据或虚假数据的问题。现实世界里的现实问题,往往就没那么简单了。

数据可获得性的概念包含3个层次:

    1)影响因素可否量化;

    2)数据掺杂“噪音”的程度与“噪音”的可排除性;

    3)数据获取成本。在使用“大数据”攻关之前,务必对目标的以上几项进行评估,以确定采用数据分析是否可行。

   譬如笔者当年在美国经手的数据分析项目,就在数据获取成本上存在问题:所有数据都来自破坏性的力学实验,而每 个样品每次实验不用说都是有成本的。在找到内在规律所需的不能再小的数据池规模(minimum data pool size)与经济上可接受的成本之间,出现了难以调和的矛盾。

   相比之下,数据分析技术*适合用在随时“生产”无成本数据,数据收集也极其便利的行当。“互联网经济”自然而然就会产生,而且自动收集成本无限趋近于零的交易数据,显然是“大数据”理想的分析研究对象。

   在这一项上,二手车交易,特别是基于网络平台的二手车交易是符合条件的。但在另外两项上,问题就出现了。比如 说,同型号以及可比型号的新车价格波动,显然是影响二手车市价的重要因素。然而国内车市的现状是,新车价格名目繁杂、波动剧烈,更有甚者在不同地区不同城 市,甚至同一个城市不同的4S店,同样的新车出现可观的价格差异也并非罕见。倘若仅根据主机厂和4S连锁总部公布的指导价来填写评估系统新车价格项的输入 数据,这里就可能带入了与实际状况出入很大的“噪音”,而且这个“噪音”的排除恐非易事。

   影响因素难以量化的问题,同样也是存在的。*明显的就是现阶段的中国特色:政策。一线城市限购的影响,如何用 数据来表达;限迁愈演愈烈的影响,又如何用数据来体现?跟阿尔法狗下棋一样,自学习式数据分析是需要积累的。倘若这些背景因素未被量化单列,那么一旦隐含 在输入数据内的基本假设出现改变,百分之九十以上的机率是以往的“学习成绩”不再适用,针对新状况的培训必须从头再来。

   总之,由于现阶段的数据可获得性上的存疑,笔者对“大数据”在二手车估价领域的运用持相对保守的态度。当然, 这绝不是说这个领域是“大数据”不能碰的。条件是在不断变化的,当前不具备的条件,或许下个月,或许一两年后就具备了。

   一个神经元网络叠加出来的深度学习系统,一旦数据可获得环节圆满解决,所用的培训检验架构正确,以互联网时代的数据“出产”率,自学习的能力与速度是惊人的。因此,把 “人工智能”科技用于车辆价格评估领域的艰苦努力,是非常值得肯定的。只是由于客观条件的影响,究竟何时评估的精度可以提到车商们要求的高标准仍然存在不确定因素。有鉴于此,笔者希望业界对于二手车估价的“自动化”一面保持清醒的认识,一面给予大力的支持。

有望立竿见影的车市技术创新

   说到这里,把话题再扩大化一些,高科技既已如此神奇,那么在这个行业,可有哪些技术手段没有客观条件的瓶颈,现在就可以立竿见影地收到投入产出效应呢。

   在笔者看来,首先是路线正确的标准化车况检测技术。事实上,这不仅是二手车交易走向诚信透明的必需品,也是二 手车估价的重要基础之一。

   从原理层面看,车辆碰撞刮蹭时遭受的破坏,说到底都是外界的动能传递到车体结构上造成的;破坏程度的大小,也不可避免的与车体结 构吸收的动能成正比。而只要金属或塑料的机械结构吃进了超出弹性限度的动能,就必然留下不可逆的塑形变形。要彻底消除这些永久变形,除非是把那辆车全拆 了,从大梁底盘到承力框架统统大换血。到了那个份上,费的劲和花的本也够再搞一辆车了。因此,通过检测车体结构的塑形变形,不仅可以判定车辆状况,而且是 条能够实现数字化的路径(而不看底盘不用举升机的“车辆检测”,不用说是耍流氓)。

   另一个有望成为业界的效益倍增器,让车市真正步入互联网经济时代的杠杆,是植根网络的虚拟现实(VR)技术。 如一位车界大咖不久前所言,转化效率乃是这个行业的生命线,而“二手车库存越大,成交几率越高”。

   不过,在这个地价房租疯狂上涨,资金往往也不便宜的时 节,高库存的代价着实不菲----展厅里的每一个车位,摆上去的每一辆汽车,都是实打实的真金白银砸在那里。任何一位经营过业务管理过展厅的兄弟姐妹,对 此间的压力与纠结想必都有深有体会。

   VR的意义在于以互联网的水银泻地无限扩展消费端的视野,将伸展到的每一个角落都变成了事实上的展厅。一旦引 入车市,仅是无边界破有边界这层意义,VR这位大神就足以全盘颠覆目下的这套秩序。从营销到成交,从前端互动模式到后端资源获取,车市VR化都将引出超乎 想象的变局。

   *后,还是回到“大数据”的话题。就在此时此刻,同样运用这一手段,基于数据分析的个性化需求匹配是个高质量 数据立等可取,技术要求甚或可以更低的努力方向。根据一位用户的交易历史、浏览习惯与背景资料,充分自学习的“人工智能”完全可以推断他/她在近期内更新 座驾的概率,并且估算出这位潜在消费者更可能倾向于哪几个品牌,更乐于认购新车还是二手车,等等等等。依据这样的数据分析,制作更准确的定向推送广告,开 发更具亲和力的APP,在买方为王日趋明显之际,可谓中国车市大有前途的“白象”。

   行文植字至此,蓦然留意到所推荐的技术路线有个共同之处,那就是着眼于为C端提供更好的消费体验。或许,不仅二手车行业,整个中国经济的出路亦在于此。就如爱迪生所言:为大众更美好的生活服务,才是发(chuang)明(xin)家存在的全部意义。



粤公网安备 44030402001323号