Personalised Recomme……

讲师风采
路节
讲师简介:
路节,澳大利亚悉尼科技大学教授。
视频简介:
个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求,推荐基于:网站最热卖商品、客户所处城市、客户过去的购买行为和购买记录,推测客户将来可能的购买行为。
发布评论
全部评论
段落信息
  这是我说的第三种,这第三种有很多种情况,其中有一个就是,可能你们都知道这个,它的基本原理是我有好多Cass在这,当来了一个新的cass我就找到了一个过去的跟它类似的Cass,那个过去的Cass用的什么样的解,我就把那个解换一换来用你这个解。其实我们每个人每天都在做类似的事情,比方说我们每个人都感冒过好多次,每一次感冒我们都打针、吃药、喝热水、睡觉来解决问题,我们都要一个解。当你再次感冒了你就会想这次感冒跟我哪次感冒很一样呢?好像跟我去年11月份那次感冒很一样,没有流鼻涕,那次我是怎么样好的呢?你就用那个方案拿来解决今天这个问题。那么在这个它也就用到了这样的一个方法来提供推荐。 现在这几种基本的方法几乎没有任何的应用,只使用单纯一个方法,几乎没有了,几乎所有的应用,包括发表的文章都是混合其中的两种或者多种方法,还有,在这些最基本的方法上做开发。目前的开发虽然有好几年了,但是它现在还存在着几个问题,这几个问题谁都想解决,大家想这么试试,那么试试,也解决了不少,但还不是特别满意。我就来给大家说说这几个问题。第一个问题是太多的空格,人们光买东西不打分,太多产品没人打分,都是空的,算都没法算。第二个就是新用户问题,我就是个新用户还懒得回答你问题,我还想让你给我推荐。还有一个是预测的准确性,因为我们有的时候不搞集体应用无所谓准确性,当你真的搞集体应用的时候公司就得要这准确性。把我们这套方法用于澳大利亚手机公司的时候他们是怎么用的?他们要推荐出来这个人,手机公司里有一个大的中心叫,雇了一帮女孩子就是往外打电话,估计出来这个用户马上要跳槽,从移动跳到联通,要跳槽,那你得先算准了他要跳槽,然后就给他推荐一个特好的,想把他留下来。那你得把这些都给,我们都放到网上的嘛,那些女孩子打了十个电话最后那十个人说我根本就没想走,或者说你给我推荐的产品我根本不喜欢,那不就白打了嘛,所以预测的精确性非常非常重要。另一个就是不确定性因素,这里边在考虑用户类似性等等特别的不确定因素。 下面我就给大家说一下第二个问题,在过去一两年里的开发,解决这样一些问题。第一个就是,这个主要解决那些特别多空格的问题。我们都知道有社会网络,特别是给企业之间都有,两个企业之间有没有信息往来,两个用户之间有没有打好多电话?是不是两个人都MSN上网等等。有时候网上给我推荐买这个、买那个我不听,但是熊梦英老师是我的好朋友,她一告诉我买我马上就听,为什么呢?我特别她。现在我们就把这个用起来了,把它用在这样就可以来解决好多空格的问题。当然你做还有一个传递等等,就把图论的理论用进来了,主要的目的就是来准确地计算用户之间的,就这一条,只要你把用户之间的计算准那你推荐精确度就高了。不要以为我们俩年龄相当这么简单,因为好多时候是两个企业,一会儿我给大家来讲。用了主要就为了提高计算的精确性。 第二个是。我们举个最简单的例子,刚才我们在一个饭馆吃了午饭,我们可能吃了好几个饭馆,这个饭馆我说好,那个饭馆你也说好,但是你说好和我说好可能根本不是一个意思。你说的好是因为特好吃,饭做得好吃,我说的好是因为那个环境特别干净,房顶特别高,说话我们都能听得清楚。他说好是因为特便宜,一个电影来了,现在《一九四二》出来了好几个人都说好,好不好说的也不一样,我说的好是因为凡是冯小刚的电影我都说好,你说好可能就是你就喜欢这种历史片,比较震撼的文艺片,另一个人说好可能就是因为张国立这个演员。因此这个东西如果光单项打分就不科学,我们考虑到多项。比如说一个,假设有四个项目,演员、导演、制片人、故事情节,这个人是打的2288、5599,不管第一个数,第一个数是平均值,它是给四个电影的打分,或者是四个饭馆的打分。还有一个人是打8822、9955,假设你要看平均值,这俩都是7、都是5,那这俩肯定是特别类似的用户,但是你要看具体的发现他打高的他打低,他打低的他打高,这俩特别不一样,不但是不类似,而且是特别不类似。所以你要是类似用户找不准,你这预测值肯定准不了。 我们通过多项的情况就看用户2和用户3这俩5599,也不对,但是你可能找到了这个用户5,用户5和用户3类似,因为他高他低,他也是高和低,虽然平均值不一样。我举这个例子的意思是通过这种方法能够提高准确的预测,这个是我们软件系统,因为我是软件学院的,我们所有东西,数学模型、算法、软件实践这是三部曲,任何东西找到一个研究问题把数学模型搞好,我们就把它变成算法,必须得实践出软件来。这是一个软件实践的结构。 在考虑用户的时候,因为你找到社会网络这些东西有很多很多的都是语言变量,用中文人家写了一个帖子你顶,顶是一种文字,你一说特不好,这里有很多很多的语言变量,因此我们来处理语言变量,用处理,来提高的精确性。这里面包括的一些,也包括模糊值的一些东

全文文稿

收藏说明: