推荐阅读

[活动预告]SocialBeta@广州分享会开始报名 SocialBeta(www.socialbeta.cn)致力于社会化媒体的研究和资源分享,关注社会化媒体发展、社会媒体营销)、社会化设计以及社区型网站运营等有关社会化媒体的方方面面,为国内广大社会化媒体爱好者提供学习与交流的平台。 SocialBeta分享会已在北京和上海成功举行了4次分享会,此次是第一次在广州举行,希望能够结识广州的社会化媒体从业者和爱好者,共同交流与分享。 欢迎各位社会化媒体爱好者踊跃报名参加!报名请私信@菜衍青,报名格式为“姓名+手机号码”。 时间和地点: 由于红砖厂附近正在修路,因此临时更改了活动地点,改为:广东工业大学...

Read more

SocialBeta分享会@上海第二次聚会活动现场 SocialBeta分享会@上海第二次聚会成功举行,感谢@Ekstasis,@朱鹤以及每一位到场的朋友们,没能去现场,只看看微博解馋,我把这次活动的一些微博上的东西整理如下,也给没去的同学们解解馋,先上一张合影: @S1984:今天#socialbeta#聚会的大合照,poor...

Read more

【how to】提高Facebook粉丝数的10个技巧 编者言:facebook相对于我们来说,还是有点距离的,但本文介绍的10个小技巧对我们利用社会化媒体还是有些帮助的,这些都是围绕怎么和粉丝建立关系和促进对话来展开的,希望对大家有一些参考价值。 在Facebook上除了提供优质的服务外,还需与访问者建立亲密牢固的关系,下面就介绍10个技巧。 1:在你的Wall发表优秀的帖子/文章,同时进行长期的互动 要想别人”like”(喜欢)你,首先你要Likeable(可亲),一个杂乱无章的Facebook页面可是会立马“赶走“客户的。就一个Facebook...

Read more

[how to]社会化SEO四步制胜法则 关于社会化媒体营销和SEO可谓众说纷纭,以至于许多公司都很糊涂,不知道朝哪个方向走。在内容优化和如何利用社交网络与客户互动并推广内容等问题上也有着不同的模型和方法。不过在我看来,不管何种模型和方法,下面四个要点对于Social...

Read more

SocialBeta分享会@上海活动现场报道 SocialBeta分享会@上海如期成功举行,据说现场来了40来人,活动组织者@Ekstasis说自己全程都是站着的,在这里我谢谢大家对SocialBeta的支持,谢谢三位分享嘉宾的精彩分享,还要谢谢被我临时拉去帮忙的高中同学Sabrina。下面我把新浪微博上大家对本次聚会的一些现场报道整理如下,希望大家多多在新浪微博上分享你参加这次聚会的感谢,分享的时候别忘记加上#socialbeta#。 puting...

Read more

【一心一译】协同过滤(Collaborative Filtering):社会化网络的生命线

Posted by puting | Posted in 社会化媒体 | Posted on 26-05-2009

标签:, , , , , ,

9

原文作者 | Muhammad Saleem   译者 | puting

协同过滤(维基百科的定义)是通过将过滤操作在一大群人中扩散,用于过滤大量信息的一种机制。与主流媒体都有一个或少数几个编辑设定一些指导原则不同的是,协同过滤的社会化网络可以有无穷多的编辑,并随着参与者人数的增多而变地更好。

协同过滤基于以下的两个基本原则之上。

1. 群体智慧多数原则表明,随着社区的成长,不仅一个大的(不同的、独立的等)社区能做出比少数编辑更好的决策,而社区的进一步壮大,其作出的决定也会也来越好。因此,比起现有的哪些武断专横的媒体,如果我们能建立一些协作过滤的报纸、电视台、广播电台等,这会更好(对这个社会来说)。事实上,正如我们将看到的一些服务,如Digg YouTubeLast.fm,正试图来做这样的事情——协同过滤( CF )媒体。

 2.协同过滤的第二个原则表明,在任何一个大型的社区中,只要拥有单个参与者以及他们之间是如何合作、如何彼此关联的足够数据,基于他们过去的爱好,我们就可以推测出,这些用户今后将会喜欢什么,也就是创造了一个协作过滤推荐引擎。当然,这依赖于一个事实,即人们的利益、偏好、以及意识形态不会随着时间的改变而发生巨大的变化。

 协同过滤系统的这两个方面会产生两个非常不同的重要效果。

通过社区的判定,协同过滤的第一个效果是让你发现一些新的、有趣的、富有娱乐性的、以及有新闻价值的信息,Digg头版就是一个这样的很好例子。并非所有的内容都将直接和你的兴趣相关联,事实上有些内容则完全和您不相干。然而,随着社区的发展,会变地越来越多样化和富有个性,基于大众兴趣而推荐到头版的新闻能满足社区成员中的普遍兴趣。如果对这些基于普遍兴趣的新闻不满意呢?这就是第二个方面的效果。

协同过滤系统的第二个效果是收集的信息是基于哪种内容、你喜欢还是不喜欢的评注,并根据您提交并参加投票的习惯,这些正是用户数据概况。这可以帮助网站向用户推荐一些由你基本认同的用户(或来源)提交的内容,以及找到一些您通常经常参与投票和评论的有趣主题。这意味着,通过收集你是如何与该网站以及与其他用户交往的足够信息,协同过滤( CF )系统可以为你推荐内容。该系统发现内容并将其提供给您,而不需要你去搜寻这些。此外,随着您越来越多地使用推荐系统以及“顶和踩”的机制,这个协同过滤系统给你推荐的内容也会变地越来越精确。

一个很重要的事实,许多社会化网站并没有意识到这点,即协同过滤( CF )系统并不能根据您的喜好自动匹配内容,它有天然的缺陷。原因很简单:除非你能获得完全的多样性和独立的看法,对于某一特定的平台,一种观点总是支配着另外一种。在一个社会化网站上面,如果占主导地位的观点是左倾的,那么右翼观点几乎每次都会被淹没,因为他们没有能力将最合适的内容传递给最关注的人群。
 
一个很好的例子,德州议员保罗的支持者们很容易能够操纵社会新闻网站。现在,如果你能符合右翼分子的右翼观点,也能符合持左翼观点的左翼分子,并让对这两种观点有兴趣的人进行健康的超越党派政治的辩论,那么你就接近了的理想的系统。一个具有以偏好为基础的推荐功能的过滤系统,本质上来说,是社会化网络的未来。

谁在运用这样的系统?

协同过滤( CF )系统毫无疑问是社会化网络的生命线。尽管不同的平台使用的程度不同,该系统依然是核心,如果没有它,就像没有积极的交通治安,社会化网络显得像在拉合尔市中心的交通高峰那样。

社会化新闻网站
社会化新闻网站如digg和propeller,仅仅在首页范围内使用了协同过滤。一旦内容被推荐至首页,协同过滤系统的工作就算完成了。协同过滤系统能让你摆脱垃圾邮件和一些无创造性的思想,但它是不是最好的,因为它依赖于平均水平,而不是直接依赖于每一个参与者。虽然这些网站尝试和发展自己的推荐引擎,RedditStumbleUpon公司通过推荐引擎已经超过了他们。这两个网站也有类似的概念,一个社区头版(基于社区中普遍成员的普遍兴趣),他们根据您的历史好恶为你提供最优质和最相关的内容,以提高你的体验和激励你更多的参与。此外,正常化的Reddit头版表明一个头版符合所有办法符合和冲淡了单个用户的体验,而标准化确保每个用户能控制内容是如何分发给他们的。

最后,即使有一些网站很少或根本没有过滤(Slashdot, Fark,等) ,那些使用协同过滤系统的推荐引擎网站将继续减弱从即将提交队列积极筛选的重要性,用于提高在个人水平层次上的用户体验。

视频流和视频分享网站
在线视频网站托管和视频分享网站之间没有多大差别。像视频分享网站YouTube有多种过滤机制,往往履行相同的职能,而不依赖于可见的投票本身,例如,是由下面几点决定的:
1.目前观看视频的人数
2.对一个视频的评论数
3.一个视频的用户评价数和收藏数

以印象为基础的系统(如Spotplex)有一个问题是,你看到或评论的东西并不意味着它就是好的。事实上,有几十个YouTube视频,我按一下,不喜欢他们,然后关闭该窗口(我看到其他人用蹩脚的英语写的的那些负面评论,非常怀疑这些对于别人会有帮助) 。其他一些网站,breakFunny or Die使用类似StumbleUpon一样的支持和不支持的投票机制,以确定是否被推荐至头版。同样,虽然有查看相似和相关相关视频,查看来自一些相关用户的视频这样的选项,但还是没有推荐系统使用您的评价和favoriting习惯(和标签您喜欢)。

博客和微博客
在大多数情况下,博客运用一种综合了最多人浏览、最多人链接、最多评论以及最高评价等各种因素,来做为向你展示你可能喜欢的内容机制。这虽是一个比通过让人们反复试验和发生错误更好的方法,但这并不能确保每个访客都能对他们看到的内容感到满意。例如,在你的博客上,有两篇完全不同主题的博文可能是最受欢迎的,但我可能只会喜欢其中的一篇。与此同时,还必须弄清楚,什么时候开始监控每个独立的用户才是经济且及时有效的?

StumbleUpon是解决了这个问题的’大家伙’ ,让你StumbleThru一个可能有你最喜欢的内容的网站,然而,这一特色,并非适用于所有的网站。

遗憾的是,绝大数微博客网站,还没有任何过滤系统。在twitter及其同类网站中,信噪比的争论异常的激烈。 不过,FriendFeed 发布了一个最基本的推荐功能,简单地展示了一些“最受欢迎”和“最多评论”的链接。

图片存储和分享网站
当我考虑协同过滤系统的时候,图片分享网站如Flickr和photobucket根本不在我的视线范围内,其中一个原因是我知道大部分使用这些网站的用户主要是为了存储和找一些cc版权的图片嵌入到他们的网站中,不过,我很惊喜地发现flickr已能帮助人们
探索和发现一些好的图片。
 
这项对于大多数人可能是熟悉的功能是有趣的,也相当的强劲。它会考虑到如一张图片的推介流量来自哪里,谁在什么时候评论了它,谁收藏了它,又有多少人喜欢它以及其他更微妙的东西。除此之外,该网站还拥有其他一些不寻常的功能,如基于世界地图上地理标记、流行的标签、相关主题、以品质为基础的群体、相机型号和最近上传的探索。

音乐流和音乐发现网站
将推荐和发现系统结合协同过滤实施最好的例子,我所看到的都是关于音乐流和音乐发现网站。例如,在Last.fm上的实施,我认为接近完美。首先,不管你是使用他们的在线流媒体widget还是他们的客户端,Last.fm会跟踪每首你听的歌曲并收集这些数据。他们每周也会跟踪那些在你的试听列表出现和消失的艺术家们的数据,并使用这些数据为你做个性化的推荐,自动创建一个播放Last.fm向你推荐歌曲的电台。

虽然这本身就足够多的,但并不是到此为止。他们的另一个电台为您播放你通常喜欢听的歌曲,还会给你推荐整个Last.fm社区流行的歌曲,以及一些您的朋友们在听和推荐的歌曲。这是一个非常强大的聚合、过滤并推荐的系统。以下是这个推荐引擎是怎么工作的:

正如你所看到的,他们分析我听的最多的音乐家,然后推荐一些和我经常听的风格和声音都比较相似的音乐家给我。其次是根据我在网站上的好友和一些我加入的音乐群组来给我推荐一些歌曲。

那么,协同过滤和推荐会消失?
只有少数一些主流网站运用了这种协同过滤( CF )和个性化的推荐——Netflix和亚马逊是最容易想到的两家。正如你从上述中所看到的,如果没有一个推荐引擎(如看到的Flickr )这当然也有可能是一个良好的协同过滤系统。不过,如果你按照迄今最强健的推荐系统Last.fm那样增加一些推荐功能,对您的用户(因为那样用户体验会更好)和您的网站(因为用户将更多地参与和喜欢您的产品)来说,都是最好的。
—————————————————-全文结束———————————————————

延伸阅读:

[PDF] Collaborative Filtering for Orkut Communities: Discovery of User

[PDF] Socially Collaborative Filtering: Give Users Relevant Content——————————————————————————————————-这篇文章断断续续地翻译,花了周末两天时间,但是感觉还有很多的语句翻译的不是很好很专业,难免有误导,所以,建议看原文。

 

Comments (9)

对社会化媒体有兴趣,对翻译有兴趣,翻译这类内容不容易,读过来知道是什么意思,但写出来的时候就感觉找不着适当的词,博主翻译得很不错,加油!

[回复]

谢谢。

[回复]

文笔不错!

[回复]

[...] digg:最有意思的一类,用户通过自己的力量提炼出key内容,良性循环,key内容会更容易找到,但是存在大小众的问题(不想再深入了,再深入会崩溃的。这里推荐一篇文章——协同过滤,社会化网络的生命线) [...]

[...] 3.个性化推荐 在个性化方面这个很自然能联想到豆瓣,豆瓣在登录之后是按照用户的个性来组织和展示内容(个性化内容推荐),这是社会化网络内容的组织和展示的一个很重要方法。个性化内容推荐的依据还是根据用户历史行为数据,对于这方面的详细内容,可查看我之前翻译的文章(协同过滤(Collaborative Filtering):社会化网络的生命线和推荐系统:电子商务网站的“金牌销售员”)。 [...]

[...] 3.个性化推荐 在个性化方面这个很自然能联想到豆瓣,豆瓣在登录之后是按照用户的个性来组织和展示内容(个性化内容推荐),这是社会化网络内容的组织和展示的一个很重要方法。个性化内容推荐的依据还是根据用户历史行为数据,对于这方面的详细内容,可查看我之前翻译的文章(协同过滤(Collaborative Filtering):社会化网络的生命线和推荐系统:电子商务网站的“金牌销售员”)。 [...]

[...] 而在社会化网络盛行的今天,我们也经常会提到“群体智慧”(The Wisdom of Crowds 作者:James Surowiecki),在之前我翻译的一篇文章(协同过滤(Collaborative Filtering):社会化网络的生命线)中,也提到“群体智慧和多数原则表明,随着社区的成长,不仅一个大的(不同的、独立的等)社区能做出比少数编辑更好的决策,而社区的进一步壮大,其作出的决定也会也来越好。”从google到digg,从last.fm到豆瓣,无不是“群体智慧”的最好例子。 [...]

[...] 3.个性化推荐 在个性化方面这个很自然能联想到豆瓣,豆瓣在登录之后是按照用户的个性来组织和展示内容(个性化内容推荐),这是社会化网络内容的组织和展示的一个很重要方法。个性化内容推荐的依据还是根据用户历史行为数据,对于这方面的详细内容,可查看我之前翻译的文章(协同过滤(Collaborative Filtering):社会化网络的生命线和推荐系统:电子商务网站的“金牌销售员”)。 [...]

[...] 3.个性化推荐 在个性化方面这个很自然能联想到豆瓣,豆瓣在登录之后是按照用户的个性来组织和展示内容(个性化内容推荐),这是社会化网络内容的组织和展示的一个很重要方法。个性化内容推荐的依据还是根据用户历史行为数据,对于这方面的详细内容,可查看我之前翻译的文章(协同过滤(Collaborative Filtering):社会化网络的生命线和推荐系统:电子商务网站的“金牌销售员”)。 [...]

Write a comment